3) Concepts statistiques Flashcards
Quelles sont les mesures de position ? (3)
- Quartiles
- Rang centile
- Distribution normale et score standard
L’écart-type est sensible aux _______________.
Données extrêmes (outliers)
- Les quartiles c’est une des mesures de position, c’est quoi ?
- Ça mesure quoi ?
- Les quartiles sont des valeurs qui partagent les données d’une distribution en quatre parties ayant chacune 25 % des données. L’écart interquartile (l’intervalle ou l’étendue interquartile)
- Ça mesure la dispersion des données en regardant l’étalement autour de la médiane.
L’écart-type est sensible aux données extrêmes. Comment ça se fait que l’intervalle interquartile enlève l’effet des valeurs extrêmes ?
Parce que cet intervalle regarde les 50% des données qui se situent au centre de la distribution.
Le rang centile est une des mesures de position.
- C’est quoi des centiles ?
- C’est quoi un rang centile ? Ça indique quoi ?
- Ça permet quoi ?
- Les centiles sont 99 délimitations qui divisent un ensemble de données en 100 intervalles contenant chacun environ 1% des données.
- C’est le rang qu’aurait la valeur s’il y avait 100 données. Ça indique le pourcentage des données qui sont inférieures ou égalées à une donnée précise.
- Permettent d’effectuer des comparaisons entre des variables différentes
La distribution normale et le score standard sont une des mesures de position.
- Quelles sont les caractéristiques d’une variable qui suit une distribution normale ?
- Un peu plus de 99% des données normales se situent entre _____ et ______ écart-types de la moyenne.
- Distribution symétrique
- La moyenne, le mode et la médiane sont identiques
- 68% des observations sont à plu ou moins un écart-type de la moyenne
- Un peu plus de 99% des données normales se situent entre -3 et +3 écart-types de la moyenne.
Il est possible de déterminer la position relative de chaque observation en calculant ce qui s’appelle le __________________, qui correspond à ….
Score standardisé (ou le score Z)
Correspond à : (valeur - moyenne)/écart-type
Lorsque nous essayons de généraliser les résultats obtenus par un échantillon vers un plus grand nombre d’individus (population), on fait quel genre de statistiques ?
Des statistiques inférentielles (inductive)
Ça permet quoi les statistiques inférentielles ?
Permet de généraliser les résultats obtenus par un échantillon vers un plus grand nombre d’individus (population)
Permet aussi d’essayer de tirer des conclusion à propos d’une population en se basant sur les résultats observés auprès d’un échantillon.
Il existe beaucoup de techniques d’analyses statistiques pour répondre à des questions de recherche différentes, comme :
- Voir des différences entre des groupes
- Voir des différences entre des variables
Que faut-t’il faite pour comparer les moyennes de deux (ou plusieurs) groupes ?
Il fait mesurer l’effet d’une variable indépendante (de «catégories») sur une variable dépendante (continue).
Quel test faut-t’il faire pour comparer le groupe échantillon avec la population ? (Différence entre des groupes)
Test-t pour échantillon unique
Quel test faut-il faire pour comparer l’échantillon pré-test et l’échantillon post-test ? (Différence entre des groupes)
Test-t pour échantillons appariés
Quel test faut-il utiliser pour comparer un groupe A avec un groupe B? (Différence entre des groupes)
Test-t pour échantillons indépendant
Quel test faut-il faire pour comparer 3 groupes ou plus ? (Permet de faire des permutations) [différence entre des groupes]
Une analyse de variance (ANOVA) ou MANOVA (si plusieurs VD)
Quel test faut-il faire pour comparer 3 groupes ou plus avec une covariable ? (Différence entre des groupes)
Analyse de covariance (ANCOVA)
Les statistiques inférentielles permettent aussi de voir des relations entre des variables !
- Ça permet de déterminer quoi ?
- Pour évaluer la relation entre deux variables de «catégories», qu’est-ce qu’on utilise ?
- Pour évaluer la relation entre deux variables «continues», qu’est-ce qu’on utilise ?
- Permet de déterminer le degré d’association (lien) qui peut exister entre deux ou plusieurs variables.
- Test de Chi-2 (compare les occurrences observées avec les occurrences attendues)
- – Corrélation de Pearson
– Régression linéaire simple
À quoi correspond la notion de corrélation ? Ça sert à étudier quoi ?
La corrélation vérifie s’il existe une relation linéaire entre deux variables (vont toujours dans le même sens), mais ne permet PAS d’établir un lien de cause à effet (on ne sait pas quelle variable est la cause de l’autre).
Il peut avoir des corrélations hyper significatives mais qui n’ont aucun sens, donc ne valent rien (ex: manger du fromage diminuent les chance de mourir dans notre sommeil).
Qu’est-ce qu’on fait pour voir la relation entre des variables nominales ?
Un Chi-carré
Qu’est-ce qu’on fait pour voir la relation entre des variables ordinales ?
Une corrélation de Spearman
Qu’est-ce qu’on fait pour voir la relation entre des variables à intervalle ?
Une corrélation de Pearson
- C’est quoi un coefficient de corrélation ?
2. Comment peut-on déterminer si on a une bonne ou une mauvaise corrélation ?
- C’est la relation pour l’échantillon de l’étude qui a une force allant de 0 à 1.
- Corrélation …
- Faible : 0 à 0,3
- Bonne : 0,3 à 0,6
- Très bonne : 0,6 à 0,8
- Trop élevée : +0,8 (on a pt mesusé la meme affaire deux fois)
La corrélation c’est la relation pour l’échantillon de l’étude qui a une force allant de 0 à 1.
- Comment fait-on pour savoir si le test-retest a une bonne fidélité ?
- Ça veut dire quoi une corrélation + VS une corrélation - ?
- Acceptable : 0,7 à 0,8
- Bonne : 0,8 à 0,9
- Excellent : 0,9 et +
- Positif = même sens
- Négatif = sens inverse
Quels seuils de signification utilise-t-on habituellement pour comparer l’échantillon avec la population ?
p<0.05, p<0,01. p<0,001
Comment fait-on pour savoir si la proportion de variabilité de y est attribuable à x ?
Ça correspond au coefficient de ……
Ça représente quoi ?
En prenant le coefficient de corrélation au carré (r^2).
Ça correspond au coefficient de détermination !
Le “coefficient de détermination” représente la fraction de la
variance d’une variable “expliquée” par la corrélation avec une autre variable
Comment interpréter un coefficient de détermination de 0,64 ?
Ça veut dire que 64% de la variance de y est expliquée par sa corrélation avec x.
Quand on collecte nos données et qu’on les rentre dans notre fichier pour faire un graphique, on se ramasse avec un nuage de points.
- C’est quoi la différence entre une corrélation et une régression ?
• La corrélation: relation entre variable X et variable Y (2
VD)
• La droite de régression: variation de la variable X sur la variable Y (VI sur VD)
- Régression simple = Prédiction de VD par VI - Régression multiple = si plusieurs prédicteurs
Quels sont les propriétés psychométriques des tests (métrologiques) ? (3)
- Sensibilité (capacité discriminante)
- Validité
- Fidélité (répétabilité et reproductibilité)
— Cohérence interne (homogénéité)
— Test-retest
La validité est une propriété (qualité) psychométrique. Il y a plusieurs types de validité qu’on regarde… Lesquels ?
Validité :
– D’apparence (ou manifeste)
– De contenu
– De construit (convergente et discriminante)
– De critère (ou empirique) : prédictive et concomitante
La sensibilité permet de déterminer quoi ?
La sensibilité permet de déterminer :
— si le test différencie suffisamment les participants.
— la capacité du test à classer les performances des participants en les différenciant nettement les uns des autres (c’est le pouvoir discriminant des tests)
— Là capacité d’un test à détecter une variation du score vrai sur le trait mesuré
La _______________________ permet normalement de s’assurer de la sensibilité des tests.
Méthode de sélection des items
Lorsque la mesure a pour but de mesurer une caractéristique particulière, l’instrument doit avoir le meilleur pouvoir “séparateur” possible mais doit aussi avoir une forte “spécificité”
C’est quoi la différence entre la sensibilité et la spécificité ?
SENSIBILITÉ :
— Capacité de l’instrument à identifier correctement les personnes présentant les caractéristiques que l’on souhaite étudier.
— Mesure la proportion de personnes présentant les caractéristiques étudiées qui est identifiée par le test
SPÉCIFICITÉ :
— Capacité de l’instrument à identifier correctement les personnes ne portant PAS cette caractéristique
— Le coefficient de spécificité correspond à la probabilité d’identifier correctement une personne ne présentant pas la caractéristique étudiée
Quel est l’effet du nombre d’items d’un test sur la sensibilité (dans la construction d’un test) ?
Plus le nombre d’items est grand (si relativement homogènes) et plus c’est possible d’établir des différences entre individus (augmentation de la variable totale du test)
Quel est l’effet du niveau de difficulté des items sur la sensibilité ?
Le test doit être adapté à la population : les items doivent être de difficultés différentes afin de discriminer les sujets afin :
1. Éviter l'effet plafond (tendance d’un ensemble de données à se stabiliser à un maximum) 2. Éviter l’effet plancher (à un minimum)
Que faut-il faire pour étudier la sensibilité d’un test ?
Établir la distribution des résultats et d’examiner sa forme (si normale ou non) via le calcul d’incises de dispersion (écart-type ou autre), d’asymétrie ou d’aplatissement.
Une distribution qui n’est pas une distribution normale indique quoi ? (Sensibilité)
Si la distribution n’est pas une distribution normale, la sélection des questions étaient probablement incorrecte et le choix des questions doit être revue et/ou les questions remaniées (en supposant qu’on a fait un bon échantillonnage) -