cours 11 Flashcards
quels sont les deux façons de faire de l’inférence ?
- l’intervalle de confiance
- le test d’hypothèse
l’inférence c’est quoi?
consiste à tirer des conclusions ou formuler des jugements sur une population entière en se basant sur les observations effectuées dans un échantillon
Qu’est-ce qu’un test d’hypothèse
permet l’inférence en évaluant si une condition est vraie ou non
H0 (hypothèse nulle) présume quoi?
présume l’absence d’effet d’un facteur
H1 ou HA (hypothèse de recherche) présume quoi
présume l’effet d’un facteur
dans les démarches statistiques, quelle hypothèse est utilisé?
H0
comment nomme-t-on hypothèse de recherche dans une démarche statistique
hypothèse alternative
vrai ou faux : dans une démarche statistique, on suppose à priori que H0 est vrai
vrai
comment un test d’hypothèse utilise les probabilités différemment que l’IC
on regarde plutot ces quoi les probabilité quon se trompe (on test la probabilité de l’erreur au lieu de la certitude)
Lequel est en lien a un test d’hypothèse et lequel est en lien à un IC?
1.”je suis certaine à 95% que …”
2.”j’ai 5% de chances de me tromper”
- IC
- test d’hypothèse
Quels sont les deux types d’erreurs dans la décision statistique (rejeter ou non H0)
erreur de type 1 : probabilité de rejeter H0 alors quelle est vraie en réalité (erreur relié au hasard)
erreur de type 2 : probabilité d’accepter H0 alors quelle est fausse en réalité (erreur liée à la puissance statistique de l’étude)
quelles sont les différents types d’hypothèses qui peuvent être évalués
- un seul échantillon comparé à une valeur attendue
- deux échantillons comparés l’un à l’autre (échantillons indépendants, échantillons appariés)
Expliquer Échantillons indépendants
observations issues de populations différentes (deux groupes différents)
Expliquer échantillons appariés
observations issues d’une même population
Quels sont les différents tests d’hypothèses
- test Z
- Test t
- ANOVA
le test Z est approprié pour combien et pour quel type d’échantillon
- pour 1 échantillon
- échantillon de grande taille (>30)
Qu’est-ce qu’un test Z
test d’hypothèse qui utilise la valeur Z pour associer une probabilité à une condition décrite par l’hypothèse nulle
Quels sont les deux façons de déterminer la bonne hypothèse à l’aide du test Z
- on prend notre z qui est associé à une probabilité et on compare cette probabilité au seuil alpha
- on compare notre z calculé et notre z critique
où se trouve la/les zone(s) de rejet de H0 dans un :
1. test unilatéral à droite
2. test unilatéral à gauche
3. test bilatéral
- zone de rejet est situé à l’extrémité droite de la courbe normale centré réduite
- zone de rejet est situé à l’extrémité gauche de la courbe normale centré réduite
- zones de rejet au deux extrémités
le test t est approprié pour combien et pour quel type d’échantillon
- 1 échantillon (<30)
- 2 échantillons indépendants
- 2 échantillons appariés
ANOVA est approprié pour combien et pour quel type d’échantillon
- quand on a plus de deux échantillons (plus de deux groupes à comparer)
Quand utilise-t-on le test t ?
On utilise le test t lorsque l’écart-type de l’échantillon (s) n’est pas un bon estimateur de l’écart-type de la population (σ), notamment avec un échantillon de petite taille.
Quelle est la différence entre un test Z et un test t ?
Contrairement au test Z, le test t est utilisé lorsque l’échantillon est petit et que l’écart-type de la population est inconnu.
Comment détermine-t-on si on rejette l’hypothèse nulle dans un test t avec un échantillon ?
On calcule la valeur t observée, puis on la compare à la valeur t critique issue de la table (selon le seuil de signification α et les degrés de liberté). Si t calculé >t critique, on rejette l’hypothèse nulle.
Comment le test t varie-t-il entre des échantillons indépendants et appariés ?
Pour deux échantillons indépendants, la formule de t compare directement les deux moyennes en tenant compte des variances des échantillons.
Pour deux échantillons appariés, la formule inclut une covariance (COV(X1,X2) qui décrit la relation entre les deux distributions.
Quels facteurs augmentent la valeur t dans le test t pour deux échantillons ?
La valeur t augmente lorsque :
- La différence entre les moyennes des échantillons augmente.
- La variance des échantillons diminue.
- La taille des échantillons augmente.
Que signifie ANOVA ?
ANOVA signifie “Analysis of Variance” et permet de comparer les moyennes de plus de deux groupes en étudiant la variabilité inter-groupes et intra-groupes.
Comment interprète-t-on la valeur F dans une ANOVA ?
Plus la valeur F est élevée, plus les groupes sont différents entre eux. Cela se produit lorsque la variance inter-groupe est supérieure à la variance intra-groupe.
Quelles sont les hypothèses d’une ANOVA ?
Hypothèse nulle (H₀) : Toutes les moyennes sont égales (μ1 = μ2=μ3=μ4)
Hypothèse alternative (H₁) : Au moins un groupe est différent.
Quand rejette-t-on l’hypothèse nulle dans une ANOVA ?
On rejette H0 si Fcalculé > Fcritique
Pourquoi les tests statistiques évaluent-ils la probabilité que H₀ soit vraie ?
Parce qu’il est difficile de prouver directement que H1 est vraie. Rejeter H0 fournit une indication indirecte que H1 pourrait être plausible, sans garantir sa véracité.
Qu’est-ce qu’une association entre deux variables ?
Une association signifie une covariation des valeurs de deux variables, c’est-à-dire que la probabilité d’observer une valeur sur X est liée à la probabilité d’observer une valeur sur Y. Cependant, une association ne signifie pas nécessairement une causalité.
Quelle est la différence entre association et causalité ?
Une association indique simplement une relation entre deux variables, tandis que la causalité implique que l’une des variables est responsable des changements observés dans l’autre.
À quoi sert le coefficient de corrélation de Pearson (r) ?
Il mesure l’intensité et la direction de la relation linéaire entre deux variables cardinales (numériques continues).
Qu’indiquent les différentes valeurs de r ?
- ↑r = association forte
- r + = l’augmentation des valeurs sur une variable s’accompagne d’une augmentation de valeurs sur l’autre variable (association +)
- r - = l’augmentation des valeurs sur une variable s’accompagne d’une diminution des valeurs sur l’autre variable (association -)
- r = 1 ou -1 = corrélation parfaite
- r = 0 = absence de relation (H0)
Qu’est-ce que le coefficient de détermination (r2)
Il indique la proportion de la variance d’une variable qui est expliquée par l’autre. Cependant, r2 ne permet pas de déterminer le sens de la relation.
Quand utilise-t-on le test du Khi-2?
Il est utilisé pour évaluer l’association entre deux variables catégorielles (ordinales ou nominales) en comparant les fréquences observées à celles attendues sous l’hypothèse d’absence d’association.
Quelles sont les hypothèses du test du Khi2
H₀ (hypothèse nulle) : Il n’y a pas d’association entre les variables (les fréquences sont distribuées de manière similaire).
H₁ (hypothèse alternative) : Il existe une association (les fréquences diffèrent de manière significative).
Quelle est la démarche pour effectuer un test du Khi2 ?
- Pour chacune des cellules, on calcule la différence entre la fréquence attendue et la fréquence observée (données réelles), on met la différence au carré et on divise par la fréquence attendue
- On fait la somme des valeurs obtenues pour l’ensemble des cellules
- On compare ensuite cette valeur de χ2 avec une valeur critique obtenue de la table à partir d’un seuil alpha déterminé par l’analyste
- On rejette H0 si χ2 calculé > χ2 critique
un nuage de points sert à quoi
permet de comprendre la relation entre deux variables cardinales