Cours 8 : Principes généraux du Test d'hypothèse et test Z Flashcards

1
Q

Test d’hypothèse

A

Utilisé pour effectuer des inférences à partir de notre
/ nos échantillon (s)
Utilisent tous une terminologie et mécanique commune, et font référence à la distribution d’échantillonnage
* Aucun test d’hypothèse requis si on a tout l’information sur la pop.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hypothèses et distribution

d’échantillonnage

A

L’hypothèse qu’il n’y a pas de différence significative entre l’échantillon et la population de référence est l’hypothèse nulle
Si l’hypothèse nulle est vraie, la distribution des échantillons tirés de la population d’intérêt seront centrées autour de μ et normalement distribuée (si N est assez grand)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Moyennes d’échantillonnage

A

Événements probables

(communs) ou improbables (rares) par rapport à la distribution des moyennes d’échantillonnage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Événement probable (commun)

A

Une différence suffisamment petite entre la moyenne observée de notre
échantillon et la moyenne hypothétique (selon l’hypothèse nulle) de notre
population
Rien de spécial a lieu
Aucune raison de rejeter l’hypothèse nulle, donc on la retiens

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Événement improbable (rare)

A

Une difference suffisamment grande entre la moyenne observée de notre
échantillon et la moyenne hypothétique (selon l’hypothèse nulle) de notre
population;
Quelque chose de special semble avoir lieu;
Avec raison, on rejette l’hypothèse nulle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Procédure générale du test d’hypothèse

A
  1. Énoncer clairement la question de recherche.
  2. Énoncer les hypotheses statistiques
  3. Définir la règle décisionnelle
  4. Calculer la statistique test appropriée
  5. Décision
  6. Interprétation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q
  1. Énoncer clairement la question de recherche
A

Une bonne question de recherche énonce clairement, en 1 phrase, les variables d’intérêt ainsi que la direction du lien entre eux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q
  1. Énoncer les hypothèses.
A

L’hypothèse nulle (H0) est énoncée afin que notre échantillon provienne de notre population de référence;
L’hypothèse alternative (H1) est énoncée afin que notre échantillon ne provienne pas de notre population de référence.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

2 types d’hypothèses

A

Unidirectionnelle (H0 : μ≥x et H1: μx)

Bidirectionnelle (H0 : μ=x et H1: μ≠x)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q
  1. Définir la règle décisionnelle
A

Règle mathématique qui spécifie précisément quand H0
doit être rejetée;
Détermine la valeur critique de notre test statistique → définie à l’aide du niveau de signification

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Le niveau de signification (α)

A

Indique le niveau de rareté que doit avoir notre résultat pour qu’on rejette l’hypothèse nulle (H0);
Dépend du type d’erreur qu’on souhaite minimiser (faux positif ou faux négatif)
Consensus pour α = 0,05

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Zone critique (en jaune)

A

Défini en fonction d’une score z critique qui sépare les résultats rares et communs, dictant ainsi quand est-ce qu’on rejette H0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Proportion totale de notre zone critique

A

Égale à notre niveau de
signification (α)
P correspond à l’aire sous la courbe et hachurée dans la zone colorée
Pour hypothèse bidirectionnelle: P = I - α ; P (jaune) = α/2
Pour hypothèse unidirectionnelle: P = 1 - α et P(jaune) = α

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q
  1. Décision
A

Notre conclusion doit contenir:
◦ Comparaison de la valeur test et critique.
◦ Décision à propos de l’hypothèse nulle.
◦ Niveau de signification de la décision.
◦ Énoncé en function de la question de recherche

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Conditions du Test-z pour la moyenne d’une population

A

Population normalement distribuée OU la taille de l’échantillon est
suffisamment grande pour satisfaire les exigences du théorême de limite
centrale.
La valeur de μ de la population est connue.
Données indépendantes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Meilleur estimé de 𝜎

A

Pour trouver 𝜎𝑋ത , il faut connaître 𝜎 et n

On utilise s à la place

17
Q

L’erreur standard

A

représente la difference moyenne entre la moyenne

d’échantillons et de la moyenne de la population

18
Q

Minimiser les décisions incorrectes

A

Si H0 est vraie, c’est probable que la plupart des échantillons extraits de la population mèneront à des decisions qui font en sorte qu’on retiens
l’hypothèse nulle.
Si H0 est clairement faux, c’est probable que la plupart des échantillons extraits de notre population nous permettent de rejeter l’hypothèse nulle;
*à la longue, la plupart des decisions seront correctes – pourvu que l’hypothèse nulle est soit vraie ou clairement fausse

19
Q

Retenir H0 est une décision “faible”

A

Un ensemble de valeurs différentes de μ0 et de la statistique test peuvent
produire un non rejet de H0
Donc si on retiens H0, cela ne veut pas dire que H0 est vrai, mais qu’on n’a pas rejeté H0, et que H0 est peut-être vrai

20
Q

Rejeter H0 est une décision “forte”

A

La decision de rejeter H0 est base sur un résultat peu probable et implique que H0
est fort probablement faux (et que H1 est probablement vraie)

21
Q

Quatre résultats d’un test

d’hypothèse

A

Conserver H0 et H0 est vrai = décision correcte
Conserver H0 et H0 est faux = erreur de type II
Rejeter H0 et H0 est vrai = erreur type I
Rejeter H0 et H0 est faux = décision correcte

22
Q

Erreur de type I

A

Rejeter l’hypothèse nulle lorsqu’elle est vraie.

La probabilité d’erreur de Type I est déterminée par le seuil de signification α

23
Q

Erreur de type II

A

Retenir l’hypothèse nulle lorsqu’elle est fausse.
Voir β plus tard
* La possibilité de commettre une erreur de type I ou II n’est jamais de 0, car on ne sait pas si H0 est vrai ou faux

24
Q

Effet

A

Différence entre la moyenne hypothétique (hypothèse nulle) et véritable d’une population
Si H0 est vrai… PAS D’EFFET
Si H0 est faux… et si GRAND EFFET, faible probabilité d’erreur de type II
Si H0 est faux… et si PETIT EFFET, haute probabilité d’erreur de type II

25
Q

Comment augmenter la probabilité de détecter un faux H0

A

Il faut augmenter
la taille de l’échantillon;
LOGIQUE: plus l’échantillon est grand, plus il représente la population, donc moins c’est possible d’obtenir un résultat « par la chance »
LOGIQUE2: plus l’échantillon est grand, plus l’erreur-type diminue, donc la zone d’erreur diminue

26
Q

Puissance d’un test d’hypothèse

A

Réfère à la probabilité de détecter un effet (1-β)

27
Q

Taille d’effet

A
Statistique qui permet de quantifier la magnitude (l’importance) de l’effet
en « nombre » d’écart-type; 
Il s’agit du d de Cohen; 
Interprétation:
d= 0,2 effet petit
d=0,5 effet modéré
d=0,8 effet large
28
Q

Principes du test d’hypothèse

A

Un échantillon trop grand peut produire un test d’hypothèse trop sensible qui fait en sorte que l’hypothèse nulle est rejetée même si l’effet est excessivement petit et sans importance;
Un échantillon trop petit peut empêcher la détection d’effets
importants;
Analyses de puissance (statistiques plus avancées) permettent d’identifier la taille l’échantillon requise pour produire un test d’hypothèse suffisamment sensible, cela serait possible de choisir une
quantité de sujets de façon non arbitraire (en fonction de la taille de l’effet attendue et le risque d’erreur de type I et II désiré)

29
Q

Interprétation de la signification statistique (dit que …)

A

La population de laquelle un des échantillons est différente que la population hypothétisée
(celle de H0), à moins de commettre une erreur d’inférence de type I (faux positif).
La probabilité d’erreur d’inférence de type I (faux positif) = seuil alpha.
L’effet (l’efficacité du traitement, la différence entre les groupes)

30
Q

Interprétation de la signification statistique (ne dit pas que …)

A

La différence entre deux populations est importante (une petite différence peut être
significative si l’erreur standard est réduite)
◦ Taille d’effet donne ma magnitude, l’importance de la différence
L’effet est réel (risque d’erreur toujours présent)