Cours 4 test t et puissance Flashcards
Qu’est-ce que la puissance?
C’est la probabilité de rejeter adéquatement Ho –> Donc la probabilité de conclure qu’il y a bel et bien un effet
Accepter H1 alors que H1 est vrai
1-B
Vrai ou faux
La puissance est souvent connue des chercheurs
Faux
Qu’implique le fait d’avoir une grande puissance?
Augmente la probabilité de trouver un résultat significatif
Qu’est-ce qui peut diminuer la puissance?
- Un n trop petit
2. Trop grande variabilité de la mesure
Qu’est-ce qui peut augmenter la puissance?
- Une augmentation de l’alpha
- Une différence plus grande entre les moyennes
- Un grand n et une variabilité moindre
Pourquoi une moindre grande variabilité augmenterait la puissance?
Car l’erreur type va être plus petit (nécessairement si variance petite) –> va de pair avec gros échantillons
Qu’est-ce que la taille d’effet ?
C’est la différence entre les moyennes de deux populations pondéré en écarts-types
(mu1 - mu2 / sigma)
La puissance dépend du degré de … des distributions d’échantillonnages sous … et …
La puissance dépend du degré de chevauchement des distributions d’échantillonnages sous Ho et H1
Pour une puissance plus grande, le chevauchement doit-il être important?
Non. Peu de chevauchement = grande puissance
Comment estimer la taille d’effet d?
- Via des recherche antérieures : Sur la base des recherches passées , nous pouvons souvent obtenir au moins une approximation grossière de d.
- Évaluation personnelle d’une différence signifiante : Dans de nombreux cas, un chercheur est à même de dire qu’il souhaite par exemple détecter une différence d’au moins 10 points
- Utiliser des valeurs conventionnelles (d de Cohen) : Ensemble de conventions proposés par Cohen. Les recommandations de Cohen sont utilisées comme mesure de l’importance de la différence que nous avons obtenues
d (taille d’effet proposé en valeur d’écart type)
Que signifie, par exemple, avoir une puissance de .38?
Cela veut dire que si Ho est fausse, nous avons environ 38% de chance de trouver un effet significatif –> soit une probabilité d’environ .62 de commettre une erreur de type 2 (retenir Ho alors qu’elle est fausse)
Comment savoir combien de participant nous avons besoin afin d’avoir une puissance acceptable (souvent 80%) ?
On fait le calcule inverse (cette fois ci dans la formule on à la puissance, mais pas le n –> il faut isolé le n)
Attention les formules ne sont pas les mêmes pour le test t avec 1 échantillon et pour le test t pour échantillons indépendants
Avec le …, pour obtenir une bonne puissance, il faut de grands échantillon. Malheureusement, en psychologie, les tailles d’effets sont généralement … et il faut de très grand groupe
Avec le test t, pour obtenir une bonne puissance, il faut de grands échantillon. Malheureusement, en psychologie, les tailles d’effets sont généralement petites et il faut de très grand groupe
Qu’est-ce qu’une distribution d’échantillonnage?
C’est la distribution qu’on obtient lorsqu’on calcul la moyenne des statistiques obtenue sur un grand nombre d’échantillons
Qu’indique le théorème de la limite centrale?
La distribution d’échantillonnage s’approche d’une distribution normale à mesure que N augmente
Qu’est-ce que le t?
Le t permet d’exprimer la différence entre deux valeurs en nombre d’erreur type
t = moyenne1 - moyenne2 (moyennes d’échantillons pas population) / erreur type
* erreur type est l’écart type de la distribution d’échantillonnage
Qu’elle est la différence entre les différents tests t?
La façon de calculer l’erreur type
Quand pouvons nous utiliser la distribution normale?
Lorsque sigma est connue (score z)
Quand devons nous utiliser la distribution t?
Lorsque sigma est inconnu
Autre que parce que sigma est inconnu, pourquoi prendre la distribution t? Que fait la distribution t?
Si moins de 30 unité d’observation, la distribution normale tend à surestimer les valeurs. Devient significatifs trop facilement.
La distribution t corrige avec les dl.
Donc t corrige pour la grandeur de l’échantillon
Cependant, distribution t devient normale après 30 unités d’observation.
Quel est le nombre de dl du test t?
dl = n-1
Dans le test t pour échantillon indépendant, que doit-on faire étant donné que nous avons 2 variances échantillonnales?
On utilise un estimé combiné de la variance échantillonale
Que permet l’estimé de variance?
1 ) Permet d’estimer l’erreur type
2) Calculer le test t.
Avec SPSS, qu’est-ce qui permet de vérifier le postulat d’homogénéité des variances?
Test de Levene
S’il est significatif –> les variances sont innégales
Si non significatif –> les variances sont égales
Avec quoi peut-on quantifier la taille d’effet?
Avec le d de Cohen
Petit effet –> d = .20
Moyen effet –> d = .50
Grand effet –> d = .80
Les hypothèses doivent être mutuellement … et être …. Donc elle doivent couvrirent l’ensemble des résultats
Les hypothèses doivent être mutuellement exclusive et être exhaustives. Donc elle doivent couvrirent l’ensemble des résultats
Si l’écart-type de la population est connue nous utilisons le test … tandis que s’il est inconnu, nous utilisons le test …
Si l’écart-type de la population est connue nous utilisons le test Z tandis que s’il est inconnu, nous utilisons le test t sur un échantillon
Quel est le but du test t sur un échantillon?
Vérifier si la moyenne observée sur un échantillon est plus petite/grande (unilatérale) ou indentique/différente (bilatérale) à la moyenne connue ou supposée de la population
Donc on s’intéresse à comparer la moyenne d’un seul échantillon qu’on compare à la moyenne de la population
Quel sont les dl d’un test t sur un échantillon?
dl = n-1
Quelles sont les conditions d’utilisation du test t sur un échantillon?
- On a un échantillon
2. Sigma est inconnu
On veut savoir si le niveau de détresse est plus élevé chez les étudiants en psychologie que dans d’autre domaine. Tobs (29dl) = 2.32 > tcritique(29dl) = 1.70. Quelles conclusions peut-on tirer?
- On remarque que nous sommes en présence d’une hypothèse unilatérale (Si on avait travaillé avec SPSS, ne pas oublier de divisé le p obtenue par 2, car SPSS bilatérale par défaut).
Avec nos données, on conclut que les étudiants en psychologie présentent un niveau de détresse psychologique significativement plus ÉLEVÉ que les autres étudiants en période d’examen (on postule la direction de l’effet)
Si notre hypothèse avait été bilatérale, nous aurions dit : On conclut que les étudiants en psychologie présentent un niveau de stress significativement DIFFÉRENT des autres étudiants en période d’examen (on ne postule pas la direction de l’effet)
Si mon hypothèse est unilatérale, que dois-je faire avec SPSS?
SPSS nous donne la probabilité bilatérale. Donc si notre test est unilatéral, ou doit diviser par 2 la probabilité que nous donne SPSS
Que représente la valeur du t donnée par SPSS?
SPSS nous donne la probabilité exacte associée à la valeur du t calculé. Le p calculé correspond à la plus petite portion de l’aire sour la courbe multipliée par 2 (car bilatéral par défaut dans SPSS).
Que nous permet le test t sur 2 moyennes?
De déterminer si les 2 échantillons proviennent de la même population
Quel est le calcul des dl pour échantillon indépendant?
N-2 dl
Que faire lorsqu’on a deux échantillons innégaux? Pourquoi?
On calcul la variance pondérée. Sp carré est une somme des variances pondérées par les degrés de liberté, donc qui tient compte de la taille de chacun des échantillons
Quelles sont les conditions d’utilisation du test t pour échantillons indépendants?
- On a deux échantillons indépendants
2. L’homogénéité des variances
Dans SPSS, quel test permet de vérifier l’homogénéité des variances pour le test t indépendant?
Le test de Levene
Lors de test d’hypothèse : Doit-on prendre une valeur critique positive ou négative?
- Si on s’attend à obtenir une moyenne de différence positive, prendre une valeur positive
- Si on s’attend à obtenir une moyenne de différence négative, prendre une valeur négative
- Si test bilatéral : Prendre le même signe que t observé
Comment savoir, avec SPSS, si mes variances sont homogènes ou non?
- Si le test n’est pas significatif (sig > 0.05) –> variances homogènes –> On utilise la ligne du haut pour lire le test t
- Si test est significatif (sig < ou = 0.05) –> Variance non homogène –> On utilise la ligne du bas pour lire le test t
Quel test (échantillons indépendants ou dépendants) est plus puissant statistiquement? Et pourquoi?
Le test t pour échantillons dépendants, car absence de différences individuelles. En effet, avec de grandes différences individuelles, la valeur du t tend à diminuer (car dans la formule du t, on prend la différence des moyennes et on pondère par l’écart-type des échantillons, eux même pondéré par la taille des groupes)
Ainsi, si on élimine la variabilité du aux différences individuelles, t est plus grand et il y a plus de chance de rejeter Ho
Quelle est la différence entre le test t pour échantillons indépendants et le test t pour échantillons dépendants?
Le test t pour échantillon dépendants, s’intéresse à la moyenne des différences, plutôt qu’à la différence entre les moyennes
Quelle distribution d’échantillonnage utilisons nous avec test t dépendant?
Comme on travaille avec une seule moyenne (la moyenne des différences), on utilise la même distribution d’échantillonnage que pour le test t pour un échantillon
Quel est le calcul des dl pour échantillons dépendants?
n-1
Quelles sont les conditions d’utilisation du test t pour échantillons dépendants?
- On a deux échantillons dépendants
On ne postule pas l’homogénéité des variances (on a le même groupe chaque fois)
Pourquoi est-ce important de s’assurer de l’homogénéité des variances?
S’assurer de l’homogénéité des variances, c’est de s’assurer que ce n’est pas les différences entre es participants qui influencent les résultats –> C’est d’être sur que les différences remarqué proviennent seulement de l’intervention
Pourquoi ne peut-on pas tout simplement faire la moyenne des deux écart-type lorsque nous sommes devant deux échantillons innégaux?
Car faire la moyenne donnerait un poids égal aux deux estimations, même si l’une se base sur beaucoup plus d’observation. On va donc venir pondérer l’écart-type avec le nombre de dl (qui tien compte de la taille du groupe)