Stats 3 Flashcards

1
Q

Quand utilise-t-on un test d’hypothèses

A

Quand on veut tirer une conclusion au sujet d’une hypothèse de recherche.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Combien d’énoncés comprend un test d’hypothèses ?

Quels sont-ils ?

A

Le test d’hypothèses comprend deux énoncés:

H0: le traitement n’a pas d’effet (Hypothèse nulle)
Ha ou H1: le traitement a un effet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quels sont les résultats possibles d’un test d’hypothèse ? (2)

A

Il est construit de façon à rejeter l’hypothèse nulle si les données ne la supportent pas.

Le résultat du test sera donc de rejeter ou de ne pas rejeter l’hypothèse nulle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vrai ou faux : L’hypothèse nulle et l’hypothèse alternative sont des énoncés portant sur des estimations faites à partir de l’échantillon

A

FAUX : L’hypothèse nulle et l’hypothèse alternative sont des énoncés au sujet de la population étudiée qui sont formulées à l’aide des paramètres de la population (et non des estimations faites à partir de l’échantillon).

H0 est formulée pour la population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Étapes d’un test d’hypothèse

A

1) écrire l’hypothèse nulle et l’hypothèse alternative
2) chercher la statistique du test (fonction mathématique des données)
3) quelle est la distribution de la statistique
4) calculer/trouver la valeur p de la statistique
5)comparer la valeur p à un seuil alpha déjà fixé/établi
6) déterminer si on rejette H0 ou si on ne la rejette pas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

La statistique du test d’hypothèse est calculée sur quelles données (échantillon vs population) ?

A

Échantillon.

Mais elle est formulée en fonction de la population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Sur quelle fonction statistique est basée le test d’hypothèse ?
** SAVOIR **

A

Fonction des différences de moyennes

moyenne x1 - moyenne x2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelle est la première condition à respecter pour faire un test d’hypothèse ?

A

Le modèle suit une courbe normale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelles conditions doit-on respecter pour faire un test d’hypothèse sur des échantillons indépendants ?

A

Les groupes sont indépendants

Le modèle suit une loi normale

La variance est la même dans les 2 (échantillons (indépendants) ET elle est la même dans la population. Si la variance n’est pas connue –> on fait un test d’égalité des variances

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vrai ou faux : Plus la taille d’échantillon augmente, plus la variance diminue

A

VRAI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vrai ou faux : Plus la taille d’échantillon augmente, plus la taille de l’effet observé augmente

A

Vrai
Car on divise par la variance et 1/n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelle est la distribution de t (taille de l’effet , test de différence des moyennes de 2 échantillons indépendants) sous H0 ?

A

t suit une loi de Student avec n1 + n2 - 2 degrés de liberté (ressemble à la loi normale, mais éventuellement Student perd sa symétrie)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

p-value d’un test d’hypothèse pour la différence entre 2 groupes indépendants

A

p-value = La probabilité d’obtenir une valeur statistique t plus extrême (qui dépasse) que celle observée (tobs) dans notre échantillon en supposant que l’hypothèse nulle est vraie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vrai ou faux : plus le p-value est grand, moins il y a de chance que H0 soit vraie

A

Faux.
Plus le p-value augmente, plus il y a de chance que H0 soit vraie (on ne rejette pas H0 si p > ou égale au seuil alpha fixé)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelles sont les conclusions que l’on peut tirer à partir du résultat du test d’hypothèse pour la différence entre 2 moyennes (échantillons indépendants)

A

Si on rejette H0 on peut conclure que la différence entre les moyennes est statistiquement différente de zéro (i.e. statistiquement significative) et qu’un des deux traitements (dépendant du signe de la différence) est plus efficace que l’autre.

Si on ne rejette pas H0 on peut conclure que notre étude ne détecte pas de différence significative entre les deux moyennes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Le test basé sur l’hypothèse alternative peut être ______ ou ______

A

unilatéral
bilatéral (+ commun, on cherche l’effet dans les 2 directions)

17
Q

Quand fait-on un test d’égalité des variances ?

A

Quand on ne connaît pas la variance dans 2 échantillons ou dans la population.

Avant de faire le test d’hypothèse pour la différence des moyennes.

18
Q

Quelle statistique est utilisée pour le test d’égalité des variances ?

A

Statistique de Fisher (pas un t-test)

19
Q

Quel est l’autre nom au test d’hypothèse pour la différence entre 2 moyennes ?

A

t-test

20
Q

Comment s’interprète un p-value d’un test d’égalité des variances ?

A

Comme un p-value régulier.

Si p dépasse 0,05, alors les variances sont égales (on ne rejette pas H0)

Si p est inférieur à 0,05, alors les variances ne sont pas égales (on rejette H0)

21
Q

Que fait-on avec le p-value de l’égalité des variances ?

A

On détermine quelle ligne prendre dans le test-t.
Si les variances sont égales = variance égale (et l’inverse)

22
Q

Quelles sont les conclusions que l’on peut tirer à partir du résultat du test d’hypothèse pour la différence entre 2 moyennes (échantillons dépendants, observations pairées) ?

A

Si on rejette H0 on peut conclure que la différence entre les moyennes est statistiquement différente de zéro (i.e. statistiquement significative) donc que l’intervention est efficace.

Si on ne rejette pas H0 on peut conclure que notre étude ne détecte pas de différence significative entre les deux moyennes, donc que l’intervention n’est pas efficace.

23
Q

Que faire si on ne sait pas si les observations suivent une loi normale ?

A

Les tests d’hypothèses basés sur la statistique t sont assez robustes à la non-normalité des données sauf s’il y a des données très aberrantes ou si la distribution est très asymétrique.

Si la taille de l’échantillon (n1 +n2 ) est raisonnablement grande ( > 30 ), le théorème de limite centrale nous dit que le test t demeure valide peut importe la distribution de la variable réponse. Les “p-value” seront alors approximatifs.

Si la taille des deux échantillons est petite (n1 +n2 < 30) et que la distribution de la variable réponse est asymétrique, il faut se tourner vers les statistiques non- paramétriques, qui elles n’assument pas une distribution spécifique pour la variable réponse.

24
Q

Que faut-il assumer pour approximer la loi binomiale (Z) par la loi normale pour le test des 2 proportions?

A

La taille d’échantillon est grande (np > 10)
n = taille échantillon
p = probabilité

25
Q

Si la taille d’échantillon est petite, quel test statistique utilise-t-on pour faire un test d’hypothèse pour la différence de 2 proportions?

A

On utilise un Fisher’s exact test.
Test basé sur la distribution binomiale

26
Q

Vrai ou faux : lorsque p s’approche du seuil alpha (0,05), l’écart-type s’approche de la valeur nulle

A

Vrai
Plus p est près de 0,05, plus le risque que [ ] inclut zéro augmente

27
Q

Qu’est-ce que l’ANOVA ?

A

Analyse de variance.

Généralisation de la comparaison de moyennes à K sous-populations.
K = # de groupes

28
Q

Lorsque K = 2, l’ANOVA correspond à quel test ?

A

test de Student de comparaison de 2 moyennes avec égalité des variances dans les sous-population.

29
Q

Quelles sont les hypothèses d’un test ANOVA ?

A

H0 = toutes les moyennes sont égales
H1 ou Ha : au moins 2 moyennes sont différentes

30
Q

Quelles sont les hypothèses sous-jacentes d’un ANOVA ?

A

X est distribuée normalement (suppose la normalité)

Variance dans les sous-groupes sont identiques (homoscédasticité)

31
Q

Qu’elle est la formule de décomposition de la variance ou équation d’analyse de variance ?

A

SCT = SCE + SCR

SCT : variabilité totale de l’échantillon. ne dépend pas des groupes.

SCE : variabilité des moyennes conditionnelles. expliquée par l’appartenance aux groupes.

SCR : variabilité à l’intérieur des groupes. variabilité résiduelle.

32
Q

Comment se comporte SCR quand SCE augmente (ANOVA)?

A

SCE augmente donc SCR diminue car SCT est fixe.

33
Q

La statistique F est définie par ?

A

Variabilité expliquée (SCE) et la variabilité résiduelle (SCR) corrigé par les degrés de liberté.

34
Q

Quelle est la statistique du test d’hypothèse pour la différence de 2 proportions ?

A

z
Pas t-test (Student)

35
Q

Quelle est la distribution de t (taille de l’effet , test de différence des moyennes pour des observations pairées ) sous H0 ?

A

Sous H0, la statistique t suit une loi de Student avec n-1 degré de liberté