3) Concepts statistiques Flashcards
Quelles sont les mesures de position ? (3)
- Quartiles
- Rang centile
- Distribution normale et score standard
L’écart-type est sensible aux _______________.
Données extrêmes (outliers)
- Les quartiles c’est une des mesures de position, c’est quoi ?
- Ça mesure quoi ?
- Les quartiles sont des valeurs qui partagent les données d’une distribution en quatre parties ayant chacune 25 % des données. L’écart interquartile (l’intervalle ou l’étendue interquartile)
- Ça mesure la dispersion des données en regardant l’étalement autour de la médiane.
L’écart-type est sensible aux données extrêmes. Comment ça se fait que l’intervalle interquartile enlève l’effet des valeurs extrêmes ?
Parce que cet intervalle regarde les 50% des données qui se situent au centre de la distribution.
Le rang centile est une des mesures de position.
- C’est quoi des centiles ?
- C’est quoi un rang centile ? Ça indique quoi ?
- Ça permet quoi ?
- Les centiles sont 99 délimitations qui divisent un ensemble de données en 100 intervalles contenant chacun environ 1% des données.
- C’est le rang qu’aurait la valeur s’il y avait 100 données. Ça indique le pourcentage des données qui sont inférieures ou égalées à une donnée précise.
- Permettent d’effectuer des comparaisons entre des variables différentes
La distribution normale et le score standard sont une des mesures de position.
- Quelles sont les caractéristiques d’une variable qui suit une distribution normale ?
- Un peu plus de 99% des données normales se situent entre _____ et ______ écart-types de la moyenne.
- Distribution symétrique
- La moyenne, le mode et la médiane sont identiques
- 68% des observations sont à plu ou moins un écart-type de la moyenne
- Un peu plus de 99% des données normales se situent entre -3 et +3 écart-types de la moyenne.
Il est possible de déterminer la position relative de chaque observation en calculant ce qui s’appelle le __________________, qui correspond à ….
Score standardisé (ou le score Z)
Correspond à : (valeur - moyenne)/écart-type
Lorsque nous essayons de généraliser les résultats obtenus par un échantillon vers un plus grand nombre d’individus (population), on fait quel genre de statistiques ?
Des statistiques inférentielles (inductive)
Ça permet quoi les statistiques inférentielles ?
Permet de généraliser les résultats obtenus par un échantillon vers un plus grand nombre d’individus (population)
Permet aussi d’essayer de tirer des conclusion à propos d’une population en se basant sur les résultats observés auprès d’un échantillon.
Il existe beaucoup de techniques d’analyses statistiques pour répondre à des questions de recherche différentes, comme :
- Voir des différences entre des groupes
- Voir des différences entre des variables
Que faut-t’il faite pour comparer les moyennes de deux (ou plusieurs) groupes ?
Il fait mesurer l’effet d’une variable indépendante (de «catégories») sur une variable dépendante (continue).
Quel test faut-t’il faire pour comparer le groupe échantillon avec la population ? (Différence entre des groupes)
Test-t pour échantillon unique
Quel test faut-il faire pour comparer l’échantillon pré-test et l’échantillon post-test ? (Différence entre des groupes)
Test-t pour échantillons appariés
Quel test faut-il utiliser pour comparer un groupe A avec un groupe B? (Différence entre des groupes)
Test-t pour échantillons indépendant
Quel test faut-il faire pour comparer 3 groupes ou plus ? (Permet de faire des permutations) [différence entre des groupes]
Une analyse de variance (ANOVA) ou MANOVA (si plusieurs VD)
Quel test faut-il faire pour comparer 3 groupes ou plus avec une covariable ? (Différence entre des groupes)
Analyse de covariance (ANCOVA)
Les statistiques inférentielles permettent aussi de voir des relations entre des variables !
- Ça permet de déterminer quoi ?
- Pour évaluer la relation entre deux variables de «catégories», qu’est-ce qu’on utilise ?
- Pour évaluer la relation entre deux variables «continues», qu’est-ce qu’on utilise ?
- Permet de déterminer le degré d’association (lien) qui peut exister entre deux ou plusieurs variables.
- Test de Chi-2 (compare les occurrences observées avec les occurrences attendues)
- – Corrélation de Pearson
– Régression linéaire simple
À quoi correspond la notion de corrélation ? Ça sert à étudier quoi ?
La corrélation vérifie s’il existe une relation linéaire entre deux variables (vont toujours dans le même sens), mais ne permet PAS d’établir un lien de cause à effet (on ne sait pas quelle variable est la cause de l’autre).
Il peut avoir des corrélations hyper significatives mais qui n’ont aucun sens, donc ne valent rien (ex: manger du fromage diminuent les chance de mourir dans notre sommeil).
Qu’est-ce qu’on fait pour voir la relation entre des variables nominales ?
Un Chi-carré
Qu’est-ce qu’on fait pour voir la relation entre des variables ordinales ?
Une corrélation de Spearman
Qu’est-ce qu’on fait pour voir la relation entre des variables à intervalle ?
Une corrélation de Pearson
- C’est quoi un coefficient de corrélation ?
2. Comment peut-on déterminer si on a une bonne ou une mauvaise corrélation ?
- C’est la relation pour l’échantillon de l’étude qui a une force allant de 0 à 1.
- Corrélation …
- Faible : 0 à 0,3
- Bonne : 0,3 à 0,6
- Très bonne : 0,6 à 0,8
- Trop élevée : +0,8 (on a pt mesusé la meme affaire deux fois)
La corrélation c’est la relation pour l’échantillon de l’étude qui a une force allant de 0 à 1.
- Comment fait-on pour savoir si le test-retest a une bonne fidélité ?
- Ça veut dire quoi une corrélation + VS une corrélation - ?
- Acceptable : 0,7 à 0,8
- Bonne : 0,8 à 0,9
- Excellent : 0,9 et +
- Positif = même sens
- Négatif = sens inverse
Quels seuils de signification utilise-t-on habituellement pour comparer l’échantillon avec la population ?
p<0.05, p<0,01. p<0,001
Comment fait-on pour savoir si la proportion de variabilité de y est attribuable à x ?
Ça correspond au coefficient de ……
Ça représente quoi ?
En prenant le coefficient de corrélation au carré (r^2).
Ça correspond au coefficient de détermination !
Le “coefficient de détermination” représente la fraction de la
variance d’une variable “expliquée” par la corrélation avec une autre variable