Cours 2 - Tests statistiques utilisés pour comparer des groupes , 1 : Test t à un n Flashcards

1
Q

Le test t peut ê utilisé pour rép à des questions de recherche pour des modèles impliquant..

A

-un seul n
-des n appariés
-deux n indépendants

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Les analyses de variances peuvent ê utilisées pour rép à des questions de recherche pour des modèles impliquant

A

2 moyennes ou plus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Les _____ peuvent ê utilisées pour rép à des questions de recherche pour des modèles impliquant 2 moyennes ou plus.

A

Les ANALYSES DE VARIANCES peuvent ê utilisées pour rép à des questions de recherche pour des modèles impliquant 2 moyennes ou plus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Un test t à un n évalue..

A

si une moyenne est égale à une « valeur de test » basée sur l’hypo de recherche

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Un test t à n appariés évalue..

A

si la différence des moyennes entre des observations appariées est diff de 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Un test t à n indépendants évalue..

A

si les moyennes de 2 gr indépendants sont statistiquement diff l’une de l’autre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Le test t est un type d’analyse stat couramment utilisé en psycho, particulièrement quand.. (3 éléments).
Pour comparer…

A

-les données respectent l’hypo de normalité de la distribution,
-les variances entre les gr sont homogènes
-les observations sont indépendantes

Pour comparer les moyennes de 2 gr et déterminer si les diff observées sont stat signi (p < 0,05) ou non signi (p > 0,05).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Des méthodes statistiques actuelles comme ______ sont appliquées lorsque la distribution des données n’est pas normale (pour faire test t)

A

le bootstrap

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Le bootstrap permet…

A

D’estimer la distribution d’une stat en rééchantillonnant les données d’origine, offrant ainsi une alternative robuste aux tests para qui supposent la normalité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

(Contexte de test t) Donc si ma distribution est pas normale, si je perds de la puissance dans mes analyses pcq n trop petit, il y a des façons de régler le prob, et c’est

A

le bootstrap.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Statistique t, synonyme =

A

stat de test d’hypo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Test t à un n, synonyme =

A

Test t à n unique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Un test t à un n permet d’évaluer si la moyenne de notre échantillon diffère d’une valeur constante connue, souvent désignée comme la “valeur de test”. Cette valeur de référence à :

A

1) Un pnt médian de la distribution de la variable test
2) Une valeur moyenne de la vari test sur la base de recherches précédentes
3) Le niv de chance de performance pour la vari test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

La situation suivante est un exemple de quel type de « valeur de test » que l’on peut utiliser dans un test t à un n ?

o Marcos souhaite déterminer si les étudiants ont une opinion négative ou positive des dirigeants mondiaux actuels. Il a élaboré l’Échelle Balbinotti des leaders mondiaux (ÉBLM), qui comprend les noms de 15 leaders mondiaux. Il demande à 100 étudiants d’identifier le pays que chaque dirigeant gouverne et de noter le dirigeant sur une échelle de 1 à 9, où 1 = un dirigeant fortement inutile, 5 = un dirigeant ni inutile ni valable, et 9 = un dirigeant fortement valable. Le score ÉBLM d’un élève est la note moyenne des dirigeants dont les pays ont été correctement identifiés. Marcos effectue un test t à un échantillon sur les 100 scores ÉBLM pour déterminer si la moyenne de son échantillon est différente de 5. La valeur de test de 5 a été choisie parce qu’une valeur inférieure à 5 implique une vision plus négative des dirigeants mondiaux, une valeur supérieure à 5 implique une vision plus positive des dirigeants mondiaux, et une valeur de 5 implique une vision ni négative ni positive des dirigeants mondiaux.

A

1) pnt médian de la distribution variable test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

La situation suivante est un exemple de quel type de « valeur de test » que l’on peut utiliser dans un test t à un n ?

o Marcos souhaite déterminer si les adolescents qui ne pratiquent pas de sport présentent un niveau de dépression supérieur à la moyenne des adolescents en général. Pour tester cette hypothèse, il recueille les scores de l’Échelle Balbinotti de Dépression (ÉBD) auprès de 30 adolescents ayant déclaré ne pas pratiquer de sport en dehors des cours d’éducation physique à l’école. L’ÉBD est un instrument de mesure validé et normalisé, avec une moyenne de 50 pour les adolescents de sexe masculin. Marcos réalise un test t à un échantillon sur ces 30 scores ÉBD afin de vérifier si la moyenne de cet échantillon diffère de la valeur de référence de 50.

A

2) Valeur moyenne de la vari test sur la base de recherches précédentes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

(Contexte de test t à un n, 2) valeur moyenne de la vari test sur la base de recherches précédentes)
Dans cet exemple, pq la valeur de référence 50 a-t-elle été choisie?

o Marcos souhaite déterminer si les adolescents qui ne pratiquent pas de sport présentent un niveau de dépression supérieur à la moyenne des adolescents en général. Pour tester cette hypothèse, il recueille les scores de l’Échelle Balbinotti de Dépression (ÉBD) auprès de 30 adolescents ayant déclaré ne pas pratiquer de sport en dehors des cours d’éducation physique à l’école. L’ÉBD est un instrument de mesure validé et normalisé, avec une moyenne de 50 pour les adolescents de sexe masculin. Marcos réalise un test t à un échantillon sur ces 30 scores ÉBD afin de vérifier si la moyenne de cet échantillon diffère de la valeur de référence de 50.

A

-une valeur < 50 suggère un niv de dépression inférieur à celui d’un ado masc moyen
-une valeur > 50 indique un niv de dépression + élevé
-une valeur = 50 n’implique ni plus ni moins de dépression qu’un ado masc moyen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

La situation suivante est un exemple de quel type de « valeur de test » que l’on peut utiliser dans un test t à un n ?

Marcos pense que le Test Balbinotti d’identification visuelle (TBIV) est trop difficile pour les enfants de moins de cinq ans. Ce test comprend 24 items, où, pour chaque item, une image est montrée à l’enfant pendant deux secondes. Après un délai de cinq secondes, l’enfant doit identifier cette même image parmi trois autres options. Pour évaluer cette hypothèse, Marcos recueille les scores au TBIV de 75 enfants âgés de quatre ans et réalise un test t à un échantillon pour déterminer si la moyenne des scores est différente du niveau attendu par le hasard. La probabilité qu’un enfant réponde correctement à une question est d’une sur trois, et avec 24 items au total, le niveau de chance pour l’ensemble du test est de 8 (1/3 x 24).

A

3) Le niveau de chance de performance pour la variable test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

(Contexte de test t à un n, 2) valeur moyenne de la vari test sur la base de recherches précédentes)
Dans cet exemple, qui signifie le 8?

Marcos pense que le Test Balbinotti d’identification visuelle (TBIV) est trop difficile pour les enfants de moins de cinq ans. Ce test comprend 24 items, où, pour chaque item, une image est montrée à l’enfant pendant deux secondes. Après un délai de cinq secondes, l’enfant doit identifier cette même image parmi trois autres options. Pour évaluer cette hypothèse, Marcos recueille les scores au TBIV de 75 enfants âgés de quatre ans et réalise un test t à un échantillon pour déterminer si la moyenne des scores est différente du niveau attendu par le hasard. La probabilité qu’un enfant réponde correctement à une question est d’une sur trois, et avec 24 items au total, le niveau de chance pour l’ensemble du test est de 8 (1/3 x 24).

A

-Score < 8 indique que les enfants de 4 ans performent moins bien que le hasard
-Score > 8 indique que les enfants de 4 ans performent mieux que le hasard
-Un score de 8 signifie que leur performance correspond exactement au niveau attendu par le hasard.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Quels sont les prérequis (conditions d’appli) d’un test t à un n?

A

1) La distribution des données doit ê normale
2) L’homogénéité de la variance
3) Indépendance des données
Attention si Puissance et distribution non normale
(chaque élément détaillé plus tard)

20
Q

P/r aux conditions d’appli des test t à un n, ..
1) La distribution des données doit ê normale,
2 précisions:

A

 Dans de nombreuses applications, avec une taille d’échantillon modérée (N ≈ 15), le test t à un échantillon peut fournir des valeurs p relativement précises, même en cas de légère violation de la normalité.
 Cependant, pour des tailles d’échantillon plus grandes, il peut être nécessaire d’augmenter la taille de l’échantillon pour produire des valeurs p valides, surtout si la distribution de la population est substantiellement non-normale.

21
Q

P/r aux conditions d’appli des test t à un n, ..
1) La distribution des données doit ê normale,
Comment on fait pour tester et comment on choisit le test?

A

-On va utiliser le test KS (Kolmogorov-Smirnov) quand n > 50

ou le SW (Shapiro-Wilk) quand n < 50

pour tester la normalité.

22
Q

P/r aux conditions d’appli des test t à un n, ..
1) La distribution des données doit ê normale, donc si je fais un test KS ou SW et que pas normale, qu’est-ce que je vais faire ensuite?

A

Je peux faire bootstrap OU
utiliser le non-paramétrique (pas bin bin utilisé ajd)

23
Q

P/r aux conditions d’appli des test t à un n, ..
2) L’homogénéité de la variance,

Explication générale

A

Si plusieurs gr sont comparés, il est important que les variances entre les gr soient similaires. Une violation de cette hypo peut influencer les résultats du test t.

24
Q

P/r aux conditions d’appli des test t à un n, ..
2) L’homogénéité de la variance,

un test qui regarde ça?

A

Analyse de Levene.

25
Q

P/r aux conditions d’appli des test t à un n, ..
3) Indépendance des données,

les observations doivent ê indép les une des autres. Une dép entre les observ pourrait biaiser les résultats et rendre les conclu du test incorrectes.

Par ex, si je prends des gens du gr contrôle,

A

Faut pas qu’y fassent partie du gr xpmental.

26
Q

P/r aux conditions d’appli des test t à un n, ..
4) Puissance et distribution non normale,

 La puissance de ce test peut être réduite si la distribution de la population présente une forte déviation par rapport à la normalité, notamment en cas de

A

Problèmes de Kurtosis (distribution platikurtique ou leptokurtique) ou d’asymétrie marquée.

27
Q

P/r aux conditions d’appli des test t à un n, ..
4) Puissance et distribution non normale,

La puissance de ce test peut être réduite si la distribution de la population présente une forte déviation par rapport à la normalité, notamment en cas de problèmes de Kurtosis (distribution platikurtique ou leptokurtique) ou d’asymétrie marquée.

Si j’ai très peu de données..
Puissance = ?

A

Si j’ai très peu de données (n = 15), ma puissance est limitée.

Puissance = concept basé sur le %. Si j’ai une puissance de 80, j’ai 80% de certitude de mes résultats. Le pnt le + important quand on parle de puissance, c’est le n. On va augmenter le n et augmenter la puissance ainsi de nos ana. (Trop peut devenir prob aussi, car une petite diff devient signi).

28
Q

Quand utiliser le bootstrap?
(2 éléments, 2 sous-élé)

A

a) Lorsque la normalité de la distribution des données est violée, ou que la taille de l’échantillon est trop petite pour garantir que le test t fournira des résultats valides.
b) Lorsque l’homogénéité des variances n’est pas respectée ou que les observations montrent une légère dépendance.

29
Q

Principe du bootstrap

A

méthode de rééchantillonnage consistant à tirer de nombreux sous-n (avec remise) des données observées pour estimer la distribution de la statistique test.

Plutôt que de s’appuyer sur des distributions théoriques comme la distribution normale, le bootstrap construit une distribution empirique basée sur les données réelles.
*C’est pas basé sur une théo, c’est basé sur la réalité de mes données.

30
Q

Avantages du bootstrap dans le contexte de test t à un n qui remplit pas les conditions d’appli
(3 éléments)

A

1)  Pas de supposition de normalité
2)  Robustesse aux échantillons de petite taille (ou n non-représentatifs)
3)  Puissance accrue (lorsque les hypo de normalité sont pas respectées, l’utilisation du bootstrap peut maintenir une bonne puissance stat)

31
Q

Limites du bootstrap dans le contexte de test t à un n qui remplit pas les conditions d’appli

A

1) Temps de calcul ((Le bootstrap peut être coûteux en termes de calcul, car il nécessite de nombreuses rééchantillonnages (bien que cela soit de moins en moins problématique avec les outils informatiques modernes)).
2) Dépendance à l’échantillon original (Si l’échantillon original est biaisé ou non représentatif, les résultats bootstrap peuvent également l’être. Donc si c’était problématique, ça va continuer de l’ê. )

32
Q

Les tailles d’effet (d) conventionnelles pour le test t, telles que proposées par Cohen (1988), sont

A

0,2 = petit effet
0,5 = effet modéré
0,8 = grand effet

33
Q

Par rapport à la taille d’effet (d), si 0,2 …

A

la différence entre la moyenne d’un échantillon et la valeur de référence ne représente pas au moins 0,2 écart-type, cette différence est considérée comme ayant un petit effet pratique, même si elle est statistiquement significative

34
Q

Par rapport à taille d’effet, d, ..
(dans mes mots)

A

C’est un autre concept stat qui va nous parler de l’importance réelle. C’est un peu l’importance de mes résultats. Mes résultats peuvent être signi mais avoir peu d’importance. Ex, avec une régression avec 800 cas, un r au carré de 0,008 signi… quelle importance ? Pas binbin. Pratiquement nulle…

35
Q

Par rapport à la taille d’effet (d), si 0,2 , exemple d’interprétation pratique :

A

 Même si un petit effet est détecté, cela peut signifier que la différence entre la moyenne observée et la valeur de référence (comme un score normatif ou un seuil) existe, mais qu’elle est minimale. Par exemple, dans une étude mesurant le niveau de stress après une intervention thérapeutique, un petit effet (d ≈ 0,2) peut indiquer que la thérapie a un effet réel mais modeste sur la réduction du stress. Cela suggère que bien que la thérapie soit bénéfique, elle pourrait ne pas avoir un impact majeur sur la majorité des participants.

36
Q

Une question de recherche pour un test t à un n doit exprimer..

A

la diff potentielle entre la moyenne de la vari mesurée et la valeur de référence (valeur de test)

37
Q

Une question de recherche pour un test t à un n doit exprimer La diff potentielle entre la moyenne de la vari mesurée et la valeur de réf .
Exemple :

A

Le niveau de dépression des adolescents qui ne pratiquent pas de sport est-il significativement supérieur à la moyenne (M = 50) observée chez les adolescents de sexe masculin en général ?

38
Q

Si dans résultats SPSS, j’ai un tableau
one-sample stat +
one-sample test (test value = 50),
qu’est-ce que représente le 50?

A

ma valeur a priori, celle avec qui j’ai comparée.

39
Q

o **La théorie de normalité _______ que les données soient distribuées de façon normale

A

Propose

40
Q

Pour un test t à un n,
exemples de para APA d’interprétation :

A

Un test t à un échantillon a été effectué pour évaluer si la moyenne des scores de Dépression était significativement différente de 50, la moyenne acceptée pour les adolescents de sexe masculin en général.

Avec un alpha fixé à 0,05, le test t à un échantillon était significativement différent de 50, t(29) = 2,46, p = 0,02. L’ampleur de l’effet (la taille de l’effet) (d = 0,45) indique un effet moyen”.

Les statistiques descriptives peuvent être rapportées dans le texte comme M = 54,63, SD = 10,33.

“L’intervalle de confiance à 95 % pour la moyenne ÉBD se situe entre 50,78 et 58,49, et l’hypothèse selon laquelle la moyenne ÉBD de la population est de 50 a donc été rejetée au niveau alpha de 0,05”. Ou encore : “L’intervalle de confiance à 95 % [50,78 ; 58,49] indique que l’hypothèse selon laquelle la moyenne du ÉBD de la population est de 50 a été rejetée au niveau alpha de 0,05.

“Les résultats soutiennent la conclusion selon laquelle les adolescents de sexe masculin qui ne pratiquent pas de sport en dehors de l’école sont un peu plus déprimés que la moyenne acceptée des adolescents de sexe masculin en général”.

“Les résultats soutiennent la conclusion selon laquelle les adolescents de sexe masculin qui ne pratiquent pas de sport en dehors de l’école sont un peu plus déprimés que la moyenne acceptée des adolescents de sexe masculin en général”.

41
Q

Pour un test t à un n,
exemples de para APA d’interprétation,
o 1. Décrivez le test, les variables et l’objectif du test. Par exemple :

A

 “Un test t à un échantillon a été effectué pour évaluer si la moyenne des scores de Dépression était significativement différente de 50, la moyenne acceptée pour les adolescents de sexe masculin en général”.

42
Q

Pour un test t à un n,
exemples de para APA d’interprétation,

o 3. Présentez des statistiques descriptives pertinentes, telles que la moyenne et l’écart-type pour un test t à un échantillon :

A

 Les statistiques descriptives peuvent être rapportées dans le texte comme M = 54,63, SD = 10,33.

42
Q

Pour un test t à un n,
exemples de para APA d’interprétation,
o 2. Indiquez les résultats du test statistique et la statistique de l’ampleur de l’effet. Par exemple :

A

 “Avec un alpha fixé à 0,05, le test t à un échantillon était significativement différent de 50, t(29) = 2,46, p = 0,02. L’ampleur de l’effet (la taille de l’effet) (d = 0,45) indique un effet moyen”.

43
Q

Pour un test t à un n,
exemples de para APA d’interprétation,

o 4. Indiquez un intervalle de confiance lorsque c’est possible. L’intervalle de confiance nous permet de prendre une estimation de l’intervalle du paramètre d’intérêt (par ex.: la moyenne, la différence moyenne ou la corrélation). Par exemple:

A

 “L’intervalle de confiance à 95 % pour la moyenne ÉBD se situe entre 50,78 et 58,49, et l’hypothèse selon laquelle la moyenne ÉBD de la population est de 50 a donc été rejetée au niveau alpha de 0,05”.
Ou encore : “L’intervalle de confiance à 95 % [50,78 ; 58,49] indique que l’hypothèse selon laquelle la moyenne du ÉBD de la population est de 50 a été rejetée au niveau alpha de 0,05.

44
Q

Pour un test t à un n,
exemples de para APA d’interprétation,

o 5. Résumez les conclusions spécifiques qui peuvent être tirées sur la base des analyses, mais gardez l’interprétation et l’élaboration de ces conclusions pour la section Discussion. Par exemple :

A

 “Les résultats soutiennent la conclusion selon laquelle les adolescents de sexe masculin qui ne pratiquent pas de sport en dehors de l’école sont un peu plus déprimés que la moyenne acceptée des adolescents de sexe masculin en général”.

45
Q

L’intervalle de confiance nous permet de

A

prendre une estimation de l’intervalle du paramètre d’intérêt (par ex.: la moyenne, la différence moyenne ou la corrélation).