Chapitre 8 : Les concepts de l'inférence statistique Flashcards

1
Q

Qu’est-ce que l’inférence statistique?

A

L’inférence statistique est un concept fondamental nous permettant de tirer des conclusions.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qu’une population?

A
  • La population constitue un groupe complet ou un groupe inaccessible que nous souhaitons connaître.
  • Représente 100% des informations concernant un phénomène ou un groupe
  • Représente la vérité absolu au sujet d’un phénomène, d’une caractéristique, de la relation entre deux variables, etc.
  • Théoriquement, c’est la vérité car l’information est obtenue pour toutes les personnes/entités constituant la population. **Il faut toutefois avoir une mesure valide et fidèle
  • Ensemble de personnes auxquelles s’appliquent les conclusions d’une recherche
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’un échantillon?

A
  • L’échantillon consiste en ce que nous connaissons.
  • Information disponible au sujet d’un phénomène
  • Informations obtenues en parcelle des membres ‘une population
  • Est le meilleur estimé de la population
  • Est directement mesurable
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles sont les différences entre paramètres vs statistiques?

A
  • Le terme “paramètre” est utilisé pour décrire les caractéristiques de la distribution de la population
  • Le terme “statistique” est utilisée pour décrire les caractéristiques d’un échantillon ou de la distribution de la population, par l’intermédiaire d’une inférence
  • Les caractéristiques de la distribution d’une population ou d’un échantillon sont sa moyenne, sa variance, son écart-type, son asymétrie et son aplatissement
  • Les paramètres sont décrit avec l’alphabet grec
  • Les stats sont décrits avec l’alphabet latin
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Comment utilise-t-on l’inférence statistique?

A
  • L’inférence consiste à “estimer” les paramètres à partir de stats
  • Un estimé implique toujours probabilité Ainsi, lorsque nous faisons une estimation, il est possible de faire une erreur d’inférence
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Que signifie échantillon représentatif?

A

Puisque nous avons accès qu’à l’échantillon, il faut que les carac. de l’échantillon soient similaires à celles que l’on retrouve dans la population
- Distribution d’un échantillon représentatif devrait ressembler à la distribution de la pop (forme et carac. de la courbe sont similaires)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Pourquoi est-ce important qu’un échantillon soit représentatif?

A

Car il existe toujours une incertitude face aux conclusions en raison de l’interférence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Comment peut-on constituer un échantillon représentatif pour une population dont nous ne connaissons pas les caractéristiques?

A

Il faut utiliser un échantillon aléatoire. Avec les lois du hasard, s’il contient un nombre “suffisant” d’observations, l’échantillon sera la représentation la plus fidèle de la population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quels sont les deux critères de l’échantillonnage aléatoire?

A
  • Le critère de la chance égale : chaque individu de la population a une chance égale d’être choisi
  • Le critère de l’indépendance des réponses : la réponse d’une personne ne doit pas être influencée par la réponse d’une autre
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quels sont les différents types d’échantillons aléatoires?

A
  • Aléatoire simple : chaque élément a une chance égale d’être choisi
  • Aléatoire stratifié : Les strates correspondent à des caractéristiques connues de la population (p.ex. on choisit 20% des boomers d’une compagnie)
  • Par grappes : On choisit par groupe et non par individus, l’unité d’analyse est donc un groupe.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Pourquoi est-ce que un échantillon plus grand a plus de chances d’être représentatif?

A

À cause de distribution normale, majorité des observations sont proches de la moyenne.
Ainsi, plus échantillon est grand, plus il a de chances d’inclure les observations plus rares et donc d’être représentatif.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Pourquoi est-ce que les calculs des stats et paramètres sont-ils différents?

A

Les calculs de la variance et de s sont différents dans les paramètres et stats (division par n - 1 plutôt que par n) pour produire un estimé non biaisé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

À quoi sert la division par n - 1?

A

Étant donné que les chances que les valeurs extrêmes soit inclus dans l’échantillon sont très faible, la variance et s d’un échantillon seront plus petits que ceux de la pop (biais)
La division par n - 1 compense ce biais en exagérant la variance de l’échantillon, ce qui sera une meilleure estimation de la variance de la pop.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Pourquoi ne pas diviser par n - 1 pour les paramètres?

A

En travaillant avec la population, nous n’avons pas besoin d’estimer la variance. Il n’y a pas d’inférence pcq nous avons 100% des observations. Ainsi, impo d’avoir un biais et donc aucune correction requise.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce qu’une théorie?

A

Une théorie est une représentation de la réalité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce que l’hypothèse alternative (H1)?

A
  • La prédiction que la manipulation ou expérimentation aura un effet (lien, différence entre les variables, prédiction, etc.).
  • Une conséquence observable qui sera vraie si la théorie est juste
  • Prédit que quelque chose est vrai dans la population. Mais, n’ayant pas accès à la population, l’hypothèse se vérifie par l’entremise des échantillons et des inférences.
17
Q

Qu’est-ce que l’hypothèse nulle (H0)?

A

Il s’agit que la théorie ou prédiction est erronée

18
Q

Qu’est-ce que la vérification de l’hypothèse? (NHTS)

A

Un ensemble de procédures logiques qui permettent de vérifier si l’hypothèse alternative est vraie ou si l’hypothèse nulle est fausse.

19
Q

Qu’est-ce que la signification statistique?

A
  • La signification statistique porte directement sur la relation entre l’échantillon et la population.
  • Lorsque nous trouvons une différence «statistiquement significative» entre 2 échantillons, nous inférons qu’il y a de faibles chances qu’au niveau de la population la différence entre les échantillons soit égale à 0.
    Mais il s’agit d’une inférence, l’erreur est possible
20
Q

Quel est le jeu de logique que nous faisons entre H1 et H0?

A

Si H1 prédit qu’il y aura une différence ou une corrélation, H0 prédit qu’il n’y aura pas de différence ou de corrélation.
Si nous rejetons l’hypothèse nulle (elle est « fausse »), son inverse doit nécessairement être vrai.
Le rejet de H0 mène à « l’acceptation » de H1. Mais l’inverse n’est pas le cas.
**Si H0 ne peut pas être rejetée, cela ne veut pas dire que H1 est fausse. Nous sommes limités à dire «que nous ne pouvons pas accepter H1 ».

21
Q

Comment peut-on résumer les principaux principes d’inférence en lien avec les hypothèses nulles et alternatives?

A

Si H0 est rejetée (fausse), H1 est nécessairement vraie.
Si H0 n’est pas rejetée (n’est pas fausse), il n’y a pas de preuve confirmant H1 mais H1 n’est pas nécessairement fausse.
Nous ne pouvons jamais prouver qu’une H1 est fausse (que le phénomène n’existe pas) à partir d’un échantillon.
Pour prouver que quelque chose n’existe pas, il faut examiner la population complète, ce qui est généralement irréalisable.

22
Q

Comment peut-on appliquer le concept de H0 et H1 à l’inférence?

A

La population, normalement distribuée ne peut avoir qu’une seule moyenne et la moyenne de l’échantillon est le meilleur estimé de la moyenne de la pop.
Si les moyennes des deux échantillons A et B diffèrent, les deux échantillons ne proviennent pas d’une seule population.
H1 = l(es) échantillon(s) ne provien(nen)t pas de la même population.
H0 = l(es) échantillon(s) provien(nen)t de la même population.

23
Q

Qu’est-ce que l’erreur d’échantillonnage?

A

Concept le + important pour comprendre test de l’hypothèse et concept de la signification statistique.
Il est très probable (quasi certain) que 2 échantillons de même taille, extraits de même pop, aient des moyennes différentes.
N’importe quel échantillon extrait aléatoirement d’une pop n’aura pas nécessairement la même moyenne que celle de sa pop.
L’erreur d’échantillonnage est la fluctuation naturelle entre les échantillons tirés de la même pop.
Différent échantillons extraits de la même pop ne sont pas nécessairement composées des mêmes observations.

24
Q

Qu’est-ce que l’erreur type de la moyenne?

A

L’erreur type de la moyenne («standard error») : la fluctuation naturelle entre les moyennes des échantillons tirés de la même pop.
La moyenne des échantillons extraits de la même population ne sera pas nécessairement numériquement la même.

25
Q

Comment peut-on appliquer l’erreur-type de la moyenne à H0?

A

Rejet de H0 lorsque la différence entre la moyenne des échantillons (ou entre moyenne de l’échantillon et moyenne de pop) est plus grande que l’erreur-type de la moyenne.

26
Q

Qu’est-ce que l’erreur de type I (ou alpha)?

A
  • Conclure qu’un phénomène existe alors qu’il n’existe pas
  • Conclure qu’il existe une différence entre deux moyennes, un lien entre deux variables (etc.) alors qu’en réalité il n’existe pas de différence ou de lien.
  • Conclure à tort au rejet de H0.
  • Il s’agit d’un «faux positif».
27
Q

Qu’est-ce qu’une erreur de type II (ou béta)?

A
  • Conclure qu’un phénomène n’existe pas alors qu’il existe
  • Conclure qu’il n’existe pas de différence entre deux moyennes, aucun lien entre deux variables (etc.) alors qu’en réalité la différence ou le lien existe.
  • Conclure à tort au non-rejet de H0.
  • Il s’agit d’un «faux négatif».