Stats 3 Flashcards
Quand utilise-t-on un test d’hypothèses
Quand on veut tirer une conclusion au sujet d’une hypothèse de recherche.
Combien d’énoncés comprend un test d’hypothèses ?
Quels sont-ils ?
Le test d’hypothèses comprend deux énoncés:
H0: le traitement n’a pas d’effet (Hypothèse nulle)
Ha ou H1: le traitement a un effet
Quels sont les résultats possibles d’un test d’hypothèse ? (2)
Il est construit de façon à rejeter l’hypothèse nulle si les données ne la supportent pas.
Le résultat du test sera donc de rejeter ou de ne pas rejeter l’hypothèse nulle.
Vrai ou faux : L’hypothèse nulle et l’hypothèse alternative sont des énoncés portant sur des estimations faites à partir de l’échantillon
FAUX : L’hypothèse nulle et l’hypothèse alternative sont des énoncés au sujet de la population étudiée qui sont formulées à l’aide des paramètres de la population (et non des estimations faites à partir de l’échantillon).
H0 est formulée pour la population.
Étapes d’un test d’hypothèse
1) écrire l’hypothèse nulle et l’hypothèse alternative
2) chercher la statistique du test (fonction mathématique des données)
3) quelle est la distribution de la statistique
4) calculer/trouver la valeur p de la statistique
5)comparer la valeur p à un seuil alpha déjà fixé/établi
6) déterminer si on rejette H0 ou si on ne la rejette pas.
La statistique du test d’hypothèse est calculée sur quelles données (échantillon vs population) ?
Échantillon.
Mais elle est formulée en fonction de la population
Sur quelle fonction statistique est basée le test d’hypothèse ?
** SAVOIR **
Fonction des différences de moyennes
moyenne x1 - moyenne x2
Quelle est la première condition à respecter pour faire un test d’hypothèse ?
Le modèle suit une courbe normale
Quelles conditions doit-on respecter pour faire un test d’hypothèse sur des échantillons indépendants ?
Les groupes sont indépendants
Le modèle suit une loi normale
La variance est la même dans les 2 (échantillons (indépendants) ET elle est la même dans la population. Si la variance n’est pas connue –> on fait un test d’égalité des variances
Vrai ou faux : Plus la taille d’échantillon augmente, plus la variance diminue
VRAI
Vrai ou faux : Plus la taille d’échantillon augmente, plus la taille de l’effet observé augmente
Vrai
Car on divise par la variance et 1/n
Quelle est la distribution de t (taille de l’effet , test de différence des moyennes de 2 échantillons indépendants) sous H0 ?
t suit une loi de Student avec n1 + n2 - 2 degrés de liberté (ressemble à la loi normale, mais éventuellement Student perd sa symétrie)
p-value d’un test d’hypothèse pour la différence entre 2 groupes indépendants
p-value = La probabilité d’obtenir une valeur statistique t plus extrême (qui dépasse) que celle observée (tobs) dans notre échantillon en supposant que l’hypothèse nulle est vraie.
Vrai ou faux : plus le p-value est grand, moins il y a de chance que H0 soit vraie
Faux.
Plus le p-value augmente, plus il y a de chance que H0 soit vraie (on ne rejette pas H0 si p > ou égale au seuil alpha fixé)
Quelles sont les conclusions que l’on peut tirer à partir du résultat du test d’hypothèse pour la différence entre 2 moyennes (échantillons indépendants)
Si on rejette H0 on peut conclure que la différence entre les moyennes est statistiquement différente de zéro (i.e. statistiquement significative) et qu’un des deux traitements (dépendant du signe de la différence) est plus efficace que l’autre.
Si on ne rejette pas H0 on peut conclure que notre étude ne détecte pas de différence significative entre les deux moyennes
Le test basé sur l’hypothèse alternative peut être ______ ou ______
unilatéral
bilatéral (+ commun, on cherche l’effet dans les 2 directions)
Quand fait-on un test d’égalité des variances ?
Quand on ne connaît pas la variance dans 2 échantillons ou dans la population.
Avant de faire le test d’hypothèse pour la différence des moyennes.
Quelle statistique est utilisée pour le test d’égalité des variances ?
Statistique de Fisher (pas un t-test)
Quel est l’autre nom au test d’hypothèse pour la différence entre 2 moyennes ?
t-test
Comment s’interprète un p-value d’un test d’égalité des variances ?
Comme un p-value régulier.
Si p dépasse 0,05, alors les variances sont égales (on ne rejette pas H0)
Si p est inférieur à 0,05, alors les variances ne sont pas égales (on rejette H0)
Que fait-on avec le p-value de l’égalité des variances ?
On détermine quelle ligne prendre dans le test-t.
Si les variances sont égales = variance égale (et l’inverse)
Quelles sont les conclusions que l’on peut tirer à partir du résultat du test d’hypothèse pour la différence entre 2 moyennes (échantillons dépendants, observations pairées) ?
Si on rejette H0 on peut conclure que la différence entre les moyennes est statistiquement différente de zéro (i.e. statistiquement significative) donc que l’intervention est efficace.
Si on ne rejette pas H0 on peut conclure que notre étude ne détecte pas de différence significative entre les deux moyennes, donc que l’intervention n’est pas efficace.
Que faire si on ne sait pas si les observations suivent une loi normale ?
Les tests d’hypothèses basés sur la statistique t sont assez robustes à la non-normalité des données sauf s’il y a des données très aberrantes ou si la distribution est très asymétrique.
Si la taille de l’échantillon (n1 +n2 ) est raisonnablement grande ( > 30 ), le théorème de limite centrale nous dit que le test t demeure valide peut importe la distribution de la variable réponse. Les “p-value” seront alors approximatifs.
Si la taille des deux échantillons est petite (n1 +n2 < 30) et que la distribution de la variable réponse est asymétrique, il faut se tourner vers les statistiques non- paramétriques, qui elles n’assument pas une distribution spécifique pour la variable réponse.
Que faut-il assumer pour approximer la loi binomiale (Z) par la loi normale pour le test des 2 proportions?
La taille d’échantillon est grande (np > 10)
n = taille échantillon
p = probabilité
Si la taille d’échantillon est petite, quel test statistique utilise-t-on pour faire un test d’hypothèse pour la différence de 2 proportions?
On utilise un Fisher’s exact test.
Test basé sur la distribution binomiale
Vrai ou faux : lorsque p s’approche du seuil alpha (0,05), l’écart-type s’approche de la valeur nulle
Vrai
Plus p est près de 0,05, plus le risque que [ ] inclut zéro augmente
Qu’est-ce que l’ANOVA ?
Analyse de variance.
Généralisation de la comparaison de moyennes à K sous-populations.
K = # de groupes
Lorsque K = 2, l’ANOVA correspond à quel test ?
test de Student de comparaison de 2 moyennes avec égalité des variances dans les sous-population.
Quelles sont les hypothèses d’un test ANOVA ?
H0 = toutes les moyennes sont égales
H1 ou Ha : au moins 2 moyennes sont différentes
Quelles sont les hypothèses sous-jacentes d’un ANOVA ?
X est distribuée normalement (suppose la normalité)
Variance dans les sous-groupes sont identiques (homoscédasticité)
Qu’elle est la formule de décomposition de la variance ou équation d’analyse de variance ?
SCT = SCE + SCR
SCT : variabilité totale de l’échantillon. ne dépend pas des groupes.
SCE : variabilité des moyennes conditionnelles. expliquée par l’appartenance aux groupes.
SCR : variabilité à l’intérieur des groupes. variabilité résiduelle.
Comment se comporte SCR quand SCE augmente (ANOVA)?
SCE augmente donc SCR diminue car SCT est fixe.
La statistique F est définie par ?
Variabilité expliquée (SCE) et la variabilité résiduelle (SCR) corrigé par les degrés de liberté.
Quelle est la statistique du test d’hypothèse pour la différence de 2 proportions ?
z
Pas t-test (Student)
Quelle est la distribution de t (taille de l’effet , test de différence des moyennes pour des observations pairées ) sous H0 ?
Sous H0, la statistique t suit une loi de Student avec n-1 degré de liberté