Stats 3 Flashcards by Camille St-Jean

Quand utilise-t-on un test d’hypothèses

Quand on veut tirer une conclusion au sujet d’une hypothèse de recherche.

How well did you know this?

Not at all

Perfectly

Combien d’énoncés comprend un test d’hypothèses ?

Quels sont-ils ?

Le test d’hypothèses comprend deux énoncés:

H0: le traitement n’a pas d’effet (Hypothèse nulle)
Ha ou H1: le traitement a un effet

How well did you know this?

Not at all

Perfectly

Quels sont les résultats possibles d’un test d’hypothèse ? (2)

Il est construit de façon à rejeter l’hypothèse nulle si les données ne la supportent pas.

Le résultat du test sera donc de rejeter ou de ne pas rejeter l’hypothèse nulle.

How well did you know this?

Not at all

Perfectly

Vrai ou faux : L’hypothèse nulle et l’hypothèse alternative sont des énoncés portant sur des estimations faites à partir de l’échantillon

FAUX : L’hypothèse nulle et l’hypothèse alternative sont des énoncés au sujet de la population étudiée qui sont formulées à l’aide des paramètres de la population (et non des estimations faites à partir de l’échantillon).

H0 est formulée pour la population.

How well did you know this?

Not at all

Perfectly

Étapes d’un test d’hypothèse

1) écrire l’hypothèse nulle et l’hypothèse alternative
2) chercher la statistique du test (fonction mathématique des données)
3) quelle est la distribution de la statistique
4) calculer/trouver la valeur p de la statistique
5)comparer la valeur p à un seuil alpha déjà fixé/établi
6) déterminer si on rejette H0 ou si on ne la rejette pas.

How well did you know this?

Not at all

Perfectly

La statistique du test d’hypothèse est calculée sur quelles données (échantillon vs population) ?

Échantillon.

Mais elle est formulée en fonction de la population

How well did you know this?

Not at all

Perfectly

Sur quelle fonction statistique est basée le test d’hypothèse ?
** SAVOIR **

Fonction des différences de moyennes

moyenne x1 - moyenne x2

How well did you know this?

Not at all

Perfectly

Quelle est la première condition à respecter pour faire un test d’hypothèse ?

Le modèle suit une courbe normale

How well did you know this?

Not at all

Perfectly

Quelles conditions doit-on respecter pour faire un test d’hypothèse sur des échantillons indépendants ?

Les groupes sont indépendants

Le modèle suit une loi normale

La variance est la même dans les 2 (échantillons (indépendants) ET elle est la même dans la population. Si la variance n’est pas connue –> on fait un test d’égalité des variances

How well did you know this?

Not at all

Perfectly

Vrai ou faux : Plus la taille d’échantillon augmente, plus la variance diminue

VRAI

How well did you know this?

Not at all

Perfectly

Vrai ou faux : Plus la taille d’échantillon augmente, plus la taille de l’effet observé augmente

Vrai
Car on divise par la variance et 1/n

How well did you know this?

Not at all

Perfectly

Quelle est la distribution de t (taille de l’effet , test de différence des moyennes de 2 échantillons indépendants) sous H0 ?

t suit une loi de Student avec n1 + n2 - 2 degrés de liberté (ressemble à la loi normale, mais éventuellement Student perd sa symétrie)

How well did you know this?

Not at all

Perfectly

p-value d’un test d’hypothèse pour la différence entre 2 groupes indépendants

p-value = La probabilité d’obtenir une valeur statistique t plus extrême (qui dépasse) que celle observée (tobs) dans notre échantillon en supposant que l’hypothèse nulle est vraie.

How well did you know this?

Not at all

Perfectly

Vrai ou faux : plus le p-value est grand, moins il y a de chance que H0 soit vraie

Faux.
Plus le p-value augmente, plus il y a de chance que H0 soit vraie (on ne rejette pas H0 si p > ou égale au seuil alpha fixé)

How well did you know this?

Not at all

Perfectly

Quelles sont les conclusions que l’on peut tirer à partir du résultat du test d’hypothèse pour la différence entre 2 moyennes (échantillons indépendants)

Si on rejette H0 on peut conclure que la différence entre les moyennes est statistiquement différente de zéro (i.e. statistiquement significative) et qu’un des deux traitements (dépendant du signe de la différence) est plus efficace que l’autre.

Si on ne rejette pas H0 on peut conclure que notre étude ne détecte pas de différence significative entre les deux moyennes

How well did you know this?

Not at all

Perfectly

Le test basé sur l’hypothèse alternative peut être ______ ou ______

Study These Flashcards

unilatéral
bilatéral (+ commun, on cherche l’effet dans les 2 directions)

Quand fait-on un test d’égalité des variances ?

Study These Flashcards

Quand on ne connaît pas la variance dans 2 échantillons ou dans la population.

Avant de faire le test d’hypothèse pour la différence des moyennes.

Quelle statistique est utilisée pour le test d’égalité des variances ?

Study These Flashcards

Statistique de Fisher (pas un t-test)

Quel est l’autre nom au test d’hypothèse pour la différence entre 2 moyennes ?

Study These Flashcards

t-test

Comment s’interprète un p-value d’un test d’égalité des variances ?

Study These Flashcards

Comme un p-value régulier.

Si p dépasse 0,05, alors les variances sont égales (on ne rejette pas H0)

Si p est inférieur à 0,05, alors les variances ne sont pas égales (on rejette H0)

Que fait-on avec le p-value de l’égalité des variances ?

Study These Flashcards

On détermine quelle ligne prendre dans le test-t.
Si les variances sont égales = variance égale (et l’inverse)

Quelles sont les conclusions que l’on peut tirer à partir du résultat du test d’hypothèse pour la différence entre 2 moyennes (échantillons dépendants, observations pairées) ?

Study These Flashcards

Si on rejette H0 on peut conclure que la différence entre les moyennes est statistiquement différente de zéro (i.e. statistiquement significative) donc que l’intervention est efficace.

Si on ne rejette pas H0 on peut conclure que notre étude ne détecte pas de différence significative entre les deux moyennes, donc que l’intervention n’est pas efficace.

Que faire si on ne sait pas si les observations suivent une loi normale ?

Study These Flashcards

Les tests d’hypothèses basés sur la statistique t sont assez robustes à la non-normalité des données sauf s’il y a des données très aberrantes ou si la distribution est très asymétrique.

Si la taille de l’échantillon (n1 +n2 ) est raisonnablement grande ( > 30 ), le théorème de limite centrale nous dit que le test t demeure valide peut importe la distribution de la variable réponse. Les “p-value” seront alors approximatifs.

Si la taille des deux échantillons est petite (n1 +n2 < 30) et que la distribution de la variable réponse est asymétrique, il faut se tourner vers les statistiques non- paramétriques, qui elles n’assument pas une distribution spécifique pour la variable réponse.

Que faut-il assumer pour approximer la loi binomiale (Z) par la loi normale pour le test des 2 proportions?

Study These Flashcards

La taille d’échantillon est grande (np > 10)
n = taille échantillon
p = probabilité

Si la taille d'échantillon est petite, quel test statistique utilise-t-on pour faire un test d'hypothèse pour la différence de 2 proportions?

On utilise un Fisher's exact test. Test basé sur la distribution binomiale

Vrai ou faux : lorsque p s'approche du seuil alpha (0,05), l'écart-type s'approche de la valeur nulle

Vrai Plus p est près de 0,05, plus le risque que [ ] inclut zéro augmente

Qu'est-ce que l'ANOVA ?

Analyse de variance. Généralisation de la comparaison de moyennes à K sous-populations. K = # de groupes

Lorsque K = 2, l'ANOVA correspond à quel test ?

test de Student de comparaison de 2 moyennes avec égalité des variances dans les sous-population.

Quelles sont les hypothèses d'un test ANOVA ?

H0 = toutes les moyennes sont égales H1 ou Ha : au moins 2 moyennes sont différentes

Quelles sont les hypothèses sous-jacentes d'un ANOVA ?

X est distribuée normalement (suppose la normalité) Variance dans les sous-groupes sont identiques (homoscédasticité)

Qu'elle est la formule de décomposition de la variance ou équation d'analyse de variance ?

SCT = SCE + SCR SCT : variabilité totale de l'échantillon. ne dépend pas des groupes. SCE : variabilité des moyennes conditionnelles. expliquée par l'appartenance aux groupes. SCR : variabilité à l'intérieur des groupes. variabilité résiduelle.

Comment se comporte SCR quand SCE augmente (ANOVA)?

SCE augmente donc SCR diminue car SCT est fixe.

La statistique F est définie par ?

Variabilité expliquée (SCE) et la variabilité résiduelle (SCR) corrigé par les degrés de liberté.

Quelle est la statistique du test d'hypothèse pour la différence de 2 proportions ?

z Pas t-test (Student)

Quelle est la distribution de t (taille de l'effet , test de différence des moyennes pour des observations pairées ) sous H0 ?

Sous H0, la statistique t suit une loi de Student avec n-1 degré de liberté

Stats 3 Flashcards

(35 cards)