Les tests statistiques Flashcards
Le test T (Student) est utilisé pour :
a) vérifier la relation entre 2 variables
b) déterminer la différence entre les moyennes de 2 populations
b) déterminer la différence entre les moyennes de 2 populations (µa et µb) relativement à une variable aléatoire continue
Quels sont les 2 types d’échantillon qui peuvent être testé par le test T ?
- Échantillons appariés
Tester si les moyennes du même échantillon testé à 2 reprises diffèrent (ex.: pré-test/post-test) - Échantillons indépendants
Tester si les moyennes entre deux groupes diffèrent (ex.: différences de moyenne dans le désir sexuel entre les hommes et les femmes)
VRAI OU FAUX
Les échantillons/groupes testés par le test T doivent être mutuellement exclusifs
VRAI : AUCUN.E PARTICIPANT.E ne peut faire partie des deux groupes, sinon les échantillons ne sont plus indépendants. En d’autres mots: les groupes doivent être mutuellement exclusifs.
Quel est le but du test T ?
Établir si, sur une (des) variable(s), la différence de moyenne entre deux groupes est significative - DIFFÉRENCE DE MOYENNES
Comment doit on écrire le H1 et H0 de manière statistique lorsqu’on utilise un test T ?
H0 : µ1 = µ2
H1 : µ1 > µ2 OU µ1 ˂ µ2 (dépendamment pour quel groupe on s’attend à un désir sexuel plus élevé)
VRAI OU FAUX
Lorsque l’on fait un test t avec des Échantillons appariés, ils n’ont pas besoin d’être mutuellement exclusif
FAUX : mutuellement exclusif : 2 temps différents
Quel est le seuil de signification d’un test ?
plus petit ou égal à 0,05
Quel test doit on faire pour vérifier si le test T est nécessaire ?
le test de Levene
Qu’est-ce que le test de Levene permet d’établir et par quel valeur est-ce que c’Est exprimé ?
Le test de Levene permet d’établir si les variances sont égales ou inégales (exprimé avec la valeur F)
Valeur F (Levene) non-significative (p>,05) = variances égales
Valeur F (Levene) significative (p<,05) = variances inégales
Donc, si ma Valeur F (Levene) non-significative (p>,05), est-ce que je dois faire le test T ?
Oui, mais je dois me fier aux résultats d test t de la ligne des variances égales
Quel est la première chose à vérifier devant un tableau dans la sortie d’un test T ?
Aller vérifier si le sig de la valeur f du test de Levene est plus petit ou égal à 0,05.
SI le sig est plus GRAND que 0,05 = variances ÉGALES - je vérifie donc le sig (p) de la valeur du T dans la ligne de variances égales
SI le sig est plus PETIT ou ÉGAL à 0,05 = variances INÉGALES - je vérifie donc le sig (p) de la valeur t dans la ligne de variances inégales
Quant au test T, après avoir établi si l’on doit regarder la ligne de variances égales ou inégales, que doit on faire ?
VÉRIFIER SI ON ON PEUT REJETR OU NON LE H0
Si la valeur du sig du test t est plus grande que 0,05, c’est que la différence entre les moyennes n’est pas significative, H0 ne peut donc pas être rejeté et H1 ne peut pas être confirmé - les résultats sont non significatif
Si la valeur est plus petit ou égale à 0,05, c’est que la différence est significative ! Les résultats seront donc significatifs, ce qui veut dire que je rejette le H0 !
Quant au test t, si le sig (p) de la valeur du t est significative, qu’est-ce qu’il me reste à faire ?
SAVOIR SI JE PEUX CONFIRMER H1 OU NON
Si la différence significative entre les moyennes va dans le sens que l’on avait prévu (le groupe que l’on avait identifié comme le plus élevé l’est), alors H1 est confirmé
SI la différence est significative entre les deux moyennes, mais que la différence est dans le sens contraire à notre hypothèse 1, alors on doit infirmer l’H1 et confirmer l’hypothèse alternative !
Dans un test t, quels sont les éléments à indiquer lorsque l’on répond à la question du rejet ou non du H0 ?
- on doit dire si les résultats sont significatifs ou non significatifs - ex : oui, résultats significatifs
- on doit mettre entre parenthèse la valeur du t ainsi que celle du sig (p) - ex : (t = 1,345; p = 0,182)
Dans un test t, quels sont les éléments à indiquer lorsque l’on répond si le H1 est infirmer ou confirmer ?
- oui ou non - si on peut confirmer
- justification avec des mots
- indiqué la moyenne (m) et l’écart-type (É.T.) du groupe plus élevé et la la moyenne (m), l’écart-type (É.T.) + la valeur du t ainsi que celle du sig (p)
ex : Oui: tel qu’anticipé, les hommes ont une satisfaction corporelle plus élevée (M = 5,52, É.T. = 1,90) que les femmes (M = 4,70, É.T. = 1,99; t = 2,107; p = ,038).
Si j’ai 2 variables quantitatives, quel‧s test‧s statistiques est-ce que je peux potentiellement faire ?
a. Test t
b. Anova
c. Khi-carré
d. Corrélation
e. Régression
d. Corrélation
e. Régression
Si j’ai 2 variables qualitatives, quel‧s test‧s statistiques est-ce que je peux potentiellement faire ?
a. Test t
b. Anova
c. Khi-carré
d. Corrélation
e. Régression
c. Khi-carré
Si j’ai 1 variable quantitative et 1 variable qualitative, quel‧s test‧s statistiques est-ce que je peux potentiellement faire ?
a. Test t
b. Anova
c. Khi-carré
d. Corrélation
e. Régression
a. Test t
b. Anova
Pour l’Anova et le Test t, la variable indépendante est quantitative ou qualitative ?
QUALITATIVE
Quant aux types de variables, comment est-ce que le test t et l’Anova se différencie ?
Test-T = VI nominale (quali) à 2 niveaux, VD continue (quanti)
ANOVAS = V1 nominale (quali) à 3 niveaux ou +, VD continue (quanti)
Le but du test T :
A) Différences de moyennes (µ)
B) Différences de proportions (%)
C) Lien d’association entre des variables (r)
A) Différences de moyennes (µ)
Le but de la Corrélation :
A) Différences de moyennes (µ)
B) Différences de proportions (%)
C) Lien d’association entre des variables (r)
C) Lien d’association entre des variables (r)
Le but de l’ANOVA :
A) Différences de moyennes (µ)
B) Différences de proportions (%)
C) Lien d’association entre des variables (r)
A) Différences de moyennes (µ)
Le but du Khi-Carré :
A) Différences de moyennes (µ)
B) Différences de proportions (%)
C) Lien d’association entre des variables (r)
B) Différences de proportions (%)
*différence de groupe quand même comme anova et test t - on regarde juste pas la même chose
Le but de la Régression :
A) Différences de moyennes (µ)
B) Différences de proportions (%)
C) Lien d’association entre des variables (r)
C) Lien d’association entre des variables (r)
Lorsque la VI a plus de 2 niveaux ou lorsqu’il y a plus d’une VI nominale et que la VD est continue, on utilise généralement le test stats…
ANOVA
Qu’est-ce que l’ANOVA compare ?
L’ANOVA compare la variance intragroupes (a) à la variance intergroupes (b). Une statistique F significative indique que b>a, donc que le facteur groupe (b) explique une portion significative de la variance de la VD (a).
VRAI OU FAUX
Pour qu’une ANOVA soit significative, il faut qu’il y ait plus de différence (donc de variance) INTRAGROUPE qu’INTERGROUPE
FAUX : pour une ANOVA significative, il faut qu’il y ait plus de différence (donc de variance) ENTRE des groupes qu’AU SEIN de ces groupes.
Lorsque l’on fait face aux tableaux de l’Analyse stats ANOVA, qu’elle est la première chose à vérifier ?
Si le F est significatif ou non : regarder le sig de la ligne “INTERGROUPE”
- F non-significatif: on ne rejette PAS H0
- F significatif: il existe des différences, on rejette H0
Si le sig du F du test ANOVA est significatif, qu’elle est la 2e chose à vérifier ?
Où se trouvent les différences?
Il faut aller voir le tableau de comparaisons multiples et identifier les dyades où le sig est significatif, ce sont les groupes entre lesquels il y a une différence significative
* attention, le tableau est présenté en double
Comment est-ce que l’on présente les hypothèses du test Anova statistiquement ?
H0 : 𝜇1= 𝜇2 = 𝜇3 = 𝜇4 = 𝜇5 = 𝜇6 = 𝜇7
H1 : 𝜇1 ≠ 𝜇2 ≠ 𝜇3 ≠ 𝜇4 ≠ 𝜇5 ≠ 𝜇6 ≠𝜇 7
Comment est-ce que l’on présente les résultats du test Anova ?
On identifie que la VD varie selon la VI avec la valeur du F et son SIG entre parenthèse (F=; p=). Aprs, on va identifier chaque dyade présentant une différence significative avec la moyenne et l’écart type de chaque groupe (M=; É.T.=).
ex : La durée de la RS varie selon le niveau d’éducation (F = 6.85; p ˂ 0.001). Les différences se situent entre les participants qui n’ont aucun diplôme obtenu (M = 35; É-T = 5,35) et les participants qui ont un diplôme d’étude collégial technique (M = 24,13 ; É.T. = 10,62)… etc
VRAI OU FAUX
Le postulat du khi-deux est que les observations doivent être indépendantes, chaque participant apparait une seule fois dans le tableau: les catégories des variables sont mutuellement exclusives
VRAI
Qu’est-ce que le test du khi-carré vérifie ?
Ce test vérifie si les proportions échantillonnales de chaque groupe sont également proportionnelles dans la distribution d’une variable. Donc, est-ce que les variables sont interdépendantes ou non (lien entre)
Dans un test du Khi-Carré, Si l’hypothèse nulle est vraie (les variables sont indépendantes l’une de l’autre) à quoi est-ce qu’on s’attend quant à la distribution des groupes dans les différents niveaux ?
Le poids démographique du sous-groupe de l’échantillon devrait être également distribué dans les mêmes niveaux
Quelle est la première à chose à regarder quant à l’interprétation du Khi-Carré
Vérifier si le sig du Khi-deux de Pearson est significatif ou non
Quelle est la deuxième à chose à regarder quant à l’interprétation du Khi-Carré (après avoir confirmé qu’il y a une interdépendance)
Aller voir où sont les surreprésentations / sous-représentations dans le tableau croisé !
Regarder les paires de cases où les lettres du test post-hoc sont différentes, ce qui indique les cellules qui diffèrent les unes des autres au niveau de la proportion
*on peut aussi se fier % du total dans la case totale pour comparer au % dans les différents niveaux
Qu’est-ce que l’on doit écrire quand on veut rapporter si on peut ou non rejeter le H0 en lien avec test Khi-Carré ?
On va dire si oui ou non la valeur du khi-carré est statistiquement significative et justifier avec la valeur du X2 et du sig (p) entre parenthèses
Qu’est-ce que l’on doit écrire quand on veut rapporter les résultats d’un khi-carré ?
Commencer avec “Toutes proportions gardées” et indiquer les dyades où il y a une surreprésentation / sous-représentation quant au poids démographique avec le % associé entre parenthèse
Quel est le langage statistique associé avec le Khi-carré (H0 et H1) ?
H1 : Oobs ≠ Oatt
H0 : Oobs = Oatt
La corrélation bivarié sert à quoi ?
La corrélation bivariée est utilisée pour tester une association positive ou négative entre 2 variables continues.
VRAI OU FAUX
La valeur d’une corrélation est toujours située entre -0,5 et 0,5
FAUX : La valeur d’une corrélation est toujours située entre -1 et +1
Plus on se rapproche de -1, plus les variables sont associées
a. positivement
b. négativement
Plus on se rapproche de -1, plus les variables sont négativement associées
Une corrélation de 0 indique quoi ?
Une corrélation de 0 indique qu’il n’y a pas de relation entre les variables.
Plus on se rapproche de 1, plus les variables sont associées
a. positivement
b. négativement
Plus on se rapproche de 1, plus les variables sont positivement associées
Quant aux résultats d’une corrélation, quels sont les 3 aspects à vérifier pour interpréter le tout ?
- la direction
- la force
- si l’association est significative
À quoi on fait référence lorsqu’on parle de la direction d’une corrélation ?
positive ou négative (-)
À quoi on fait référence lorsqu’on parle de la force d’une corrélation ?
Si elle est faible, modérée, forte ou multicollinéairée
Lorsqu’on parle du standard de
Cohen, à quoi fait on référence ?
À la force d’une corrélation
Une corrélation ayant une valeur de ± .5 est un corrélation
a. faible
b. modéré
c. forte
d. multicollinéarité
c. forte
Une corrélation ayant une valeur de ± .7 est un corrélation
a. faible
b. modéré
c. forte
d. multicollinéarité
d. multicollinéarité
Une corrélation ayant une valeur de ± .1 est un corrélation
a. faible
b. modéré
c. forte
d. multicollinéarité
a. faible
Une corrélation ayant une valeur de ± .3 est un corrélation
a. faible
b. modéré
c. forte
d. multicollinéarité
a. modéré
Une corrélation ayant une valeur de ± .0 est un corrélation
a. faible
b. modéré
c. forte
d. multicollinéarité
NULLE
On parle de quoi lorsque on dit que les variables sont trop corrélées ?
On parle de multicollinéarité
Qu’est-ce que la multicollinéarité implique sur le plan de la MESURE ?
un MANQUE d’EXCLUSIVITÉ
Qu’est-ce que la multicollinéarité implique sur le plan conceptuel ?
Redondance
VRAI OU FAUX
la multicollinéarité peut entraîner des imprécision des paramètres estimés
VRAI
Qu’est-ce que le r2 et quel est son avantage ?
Le carré de la corrélation (r2) représente le % de variance expliquée. Son expression en % le rend plus facile à interpréter.
Un nuage de point très serré donne quel indice quant à la corrélation ?
sa force : plus c’est serré, plus elle est forte
Si un nuage de point forme une diagonale serrée (haut à gauche et bas à droite), qu’est-ce que cela nous dit quant à la corrélation ?
Il y a une corrélation négative et forte
Si un nuage de points forme une diagonale lousse (haut à droite et bas à gauche), qu’est-ce que cela nous dit quant à la corrélation ?
Une corrélation positive d’une force probablement faible à modéré
Quelle sont les 2 limites de l’analyse de corrélation ?
- quelle est la direction de l’effet? : quelle variable explique laquelle
- l’association est-elle due à une tierce variable?
Comment est-ce que l’on écrit un H1 et un H0 d’une corrélation
H0 : rx,y = 0
H1 : rx,y < 0 (ou de l’autre côté)
Quels sont les 3 éléments que l’on doit absolument indiquer lorsque l’on écrit le résultat de l’analyse de corrélation ?
la force et la direction de la corrélation et si elle est significative
Quelles sont les différences entre l’analyse de corrélation et celle de régression ?
- Dans la régression, il peut y avoir plus que 2 variables
- Il y a un rôle asymétrique quant aux variables dans l’analyse de régression (VI et VD) : elles ne sont pas permutables comme dans la corrélation
À quelle analyse est-ce que cela fait référence :
X = variable explicative quantitative (VI) / Y = variable expliquée quantitative (VD)
régression (non permutables)
Quels sont les 3 éléments nécessaire pour considérer une relation comme causale ?
1) Il existe un lien logique entre la cause et l’effet
2) La cause précède l’effet
3) La cause et l’effet varient dans le temps et de façon concomitante
VRAI OU FAUX
Tout comme la corrélation, la régression ne permet pas d’identifier un lien causal entre 2 variables
FAUX : La régression est donc une méthode qui suppose une relation causale unidirectionnelle entre x et y, c’est-à-dire que x a un effet sur y
* PAS SURE CE N’EST PAS CLAIR DANS LES NOTES DE COURS
VRAI OU FAUX
Dans une régression, l’effet observé peut être entièrement expliqué par une seule cause
FAUX : L’effet observé ne peut être entièrement expliqué par une seule cause
La régression linéaire multiple permet QUOI (2) ?
1) La régression linéaire multiple permet l’examen d’associations entre une ou plusieurs VIs et une VD, et donc implique une direction de l’association
2) La régression permet de prendre en compte la partie de variance de la VD expliquée par chaque VI dans le modèle
Coefficient de détermination (R²) détermine quoi ?
Coefficient de détermination (R²): Détermine à quel point le modèle a une valeur explicative (à quel point les variables (VI - x) du modèle expliquent la VD (y)
VRAI OU FAUX
Un R² de ‘0’ = valeur explicative parfaite (100% de variance expliquée)
FAUX
Un R² de ‘0’ = aucune valeur explicative (0% de variance expliquée)
Un R² de ‘1’ = valeur explicative parfaite (100% de variance expliquée)
VRAI OU FAUX
Le R² (ajusté) tient compte du nombre de variables dans le modèle
VRAI
Qu’est-ce que l’on doit regarder dans les tableaux d’une régression ?
1) le R-deux ajusté : la proportion de variance de la VD expliquée par le(s) VI(s) en prenant en compte le nombre de VI(s)
2) On regarde dans le tablesu des coefficients quelles valeurs du Bêta (coefficients standardisés) sont significatives (donc quelles variables indépendantes expliquent significativement la variable dépendante)
Comment est-ce que l’on rapport les résultats d’un test de régression linéraire multiple ?
On indique quelles variables indépendantes permettent ou non d’expliquer la variable dépendante. Il faut indiquer entre parenthèse le Bêta et le sig après chaque VI (β = ; p <).
À quoi est-ce que cela fait référence :
l’hypothèse nulle est rejetée, alors qu’elle est vraie
a. Erreur de type 1
b. Résultat adéquat
c. Erreur de type 2
a. Erreur de type 1 - faux positif
(comme confirmer H1 alors que c’est faux - c’est H0 qui est vraie)
À quoi est-ce que cela fait référence :
l’hypothèse nulle est rejetée, alors qu’elle est fausse
a. Erreur de type 1
b. Résultat adéquat
c. Erreur de type 2
b. Résultat adéquat
À quoi est-ce que cela fait référence :
l’hypothèse nulle est acceptée, alors qu’elle est fausse
a. Erreur de type 1
b. Résultat adéquat
c. Erreur de type 2
c. Erreur de type 2
À quoi est-ce que cela fait référence :
l’hypothèse nulle est acceptée, alors qu’elle est vrai
a. Erreur de type 1
b. Résultat adéquat
c. Erreur de type 2
b. Résultat adéquat
Qu’est-ce qu’une erreur de type 2 ?
Faux négatif
VRAI OU FAUX
Si IC (95%): Erreur de type 1 consisterait à rejeter H0 alors que le paramètre se trouverait dans le 5% exclus par l’intervalle de confiance → le seuil de signification déterminé (p ˂ 0,05) était trop libéral
VRAI
Qu’est-ce qu’une erreur de type 1 ?
Faux positif
VRAI OU FAUX
Si IC (95%): Erreur de type 1 consisterait à accepter H0 alors que le paramètre se trouverait dans le 95% couvert par l’intervalle de confiance →
le seuil de signification déterminé (p ˂ 0,05) était trop conservateur
VRAI
Donner un exemple d’erreur de type 1 et de type 2 avec cette recherche:
Sur le plan de la panne de désir, des experts formulent l’hypothèse qu’une intervention A va être plus efficace qu’une méthode B
Type 1 : faux positif - consisterait à adopter la méthode A alors qu’elle n’est pas plus efficace
Type 2 : faux négatif - consisterait à ne pas adopter la méthode A, bien qu’il s’agisse de la méthode la plus efficace