Cours 2 Flashcards

1
Q

Quel est l’intérêt de connaître l’erreur-type ?

A

Si la distribution d’échantillonnage est distribuée normalement, connaître l’erreur type nous permet de cibler un intervalle de valeurs à l’intérieur duquel 95% des moyennes d’échantillons se trouveront!

Ex. SE = 0.55
95% des échantillons tirés se trouveront à une distance maximale de 1.10 de la moyenne de la population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce que la distribution d’échantillonnage ?

A

La distribution des probabilités d’obtenir tous les échantillons possibles

Donc, la probabilité d’obtenir chaque moyenne d’échantillon possible

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

À quoi ressemble la distribution d’échantillonnage des moyennes ?

A

Une courbe symétrique en forme de cloche (Distribution normale)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce que la théorie des erreurs ?

A

Elle explique pourquoi on obtient une courbe normale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelles sont les 3 conditions de la théorie des erreurs ?

A
  1. Le nombre de causes qui contribuent à la mesure est très grand (infinité de facteurs qui influence notre note à l’examen)
  2. Chacune de ces causes peut réussir ou échouer
  3. La probabilité d’un succès (ou d’un échec) n’est pas extrême
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce que la distribution normale ?

A

Distribution des probabilités d’obtenir les différentes valeurs possibles sur la variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

V ou F. La distribution normale correspond toujours à une courbe symétrique et en forme de cloche

A

VRAI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Que stipule le théorème central limite ?

A
  1. Même si notre échantillon ne suit pas une distribution normale, sa distribution d’échantillonnage suit bel et bien une distribution normale
  2. La distribution d’échantillonnage est centrée sur la moyenne de la population
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

À combien d’écarts types de la moyenne se situe 95% des données dans une distribution normale ?

A

+/- 2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

À combien d’erreurs types de la moyenne de la population se situe 95% des données dans une distribution normale ?

A

+/- 2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Comment déterminer les frontières de l’intervalle de confiance ?

A

À partir de notre échantillon, nous estimons que la moyenne de la population se trouve entre (mu - 2SE) et (mu + 2SE)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

V ou F. L’intervalle de confiance est à la base du test d’hypothèse.

A

VRAI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quelle conclusion peut-on tirer à partir de l’intervalle de confiance ? (EXAMEN)

A

95% des échantillons dans lequel l’intervalle de confiance va inclure la vraie moyenne de la population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que l’erreur d’échantillonnage ?

A

L’erreur type nous démontrent qu’en tirant plusieurs échantillons d’une même population, nous trouverons différentes moyennes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce qu’on utilise pour surmonter le phénomène de l’erreur d’échantillonnage ? Pourquoi ?

A

Statistiques inférentielles (inductives)

Pour obtenir des conclusions valides sur notre population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quel est l’objectif des statistiques inférentielles ?

A

Déterminer quelle était la probabilité d’obtenir l’échantillon obtenu si l’on suppose certaines caractéristiques de la population

17
Q

Si les probabilités sont très faibles, qu’est-ce qu’on conclut ?

A

La population à laquelle appartient l’échantillon ne possède pas les caractéristiques que nous avions supposées

18
Q

V ou F. Seule la conclusion des statistiques est inférentielle

A

VRAI. Toute la méthode qui précède la récolte des données en est une déductive utilisant les probabilités

19
Q

Qu’est-ce que l’hypothèse nulle ?

A

On pose certaines hypothèses sur une population

20
Q

Qu’est-ce que l’hypothèse nulle ?

A

On pose certaines hypothèses sur une population

21
Q

Quelles sont les étapes du test d’hypothèse ?

A
  1. On établit l’hypothèse nulle, puis on en déduit les probabilités d’obtenir n’importe quel échantillon
  2. On vérifie ensuite quelle était la probabilité d’obtenir notre échantillon (si la probabilité était faible, on induit que la population n’est pas celle que nous avions supposée)
22
Q

Expliquer la loi générale (EXAMEN)

A
  1. En statistique inférentielles, toute l’analyse est conduite dans un univers gouverné par une certaine loi générale
  2. Cette loi générale correspond à une distribution d’échantillonnage
  3. Cette distribution d’échantillonnage correspond à la probabilité d’obtenir chaque échantillon possible, si et seulement si ces échantillons suivie la loi générale
  4. Cette loi générale (correspond à l’hypothèse nulle) qui correspond à une distribution d’échantillon
  5. Une foie cette loi générale établie, la méthode des statistiques inférentielles procède à travers un raisonnement déductif
23
Q

Quelle est la méthode complète en statistiques inférentielles classiques ? (À REFORMULER)

A
  1. On pose une question de recherche visant à comprendre un phénomène.
  2. On pose une hypothèse nulle : une description de la loi générale dans lequel existe l’analyse.
    On établit les valeurs critiques qui permettraient de rejeter 𝐻0 avec une faible probabilité de se tromper si 𝐻0 est vrai. Cette «faible probabilité» correspond à l’erreur de type 1.
  3. On pose une hypothèse alternative (𝐻𝐴) : l’hypothèse du chercheur. Le chercheur construit un modèle du phénomène qu’il tente de comprendre. Le modèle inclut généralement une ou plusieurs variables indépendantes (i.e. unidimensionnel ou de faible dimensionnalité).
  4. On récolte un échantillon : un groupe d’observations. Le chercheur vérifie les postulats permettant de valider la loi générale. Le chercheur utilise ce groupe d’observations pour estimer les valeurs des paramètres du modèle du chercheur (i.e. l’importance des différentes variables du modèle du chercheur).
  5. On conclut. Le chercheur vérifie quelle était la probabilité d’obtenir des valeurs de paramètres qui soient au moins aussi éloignés de H0 que ceux estimés à l’aide de notre échantillon (i.e. la valeur p). Si cette probabilité est plus faible que la probabilité d’erreur de type 1* maximale établie au début, on rejette* 𝐻0.
    Sinon, on conserve* 𝐻0.
24
Q

Comment déterminer si on rejette ou non l’hypothèse nulle ?

A

Si la valeur de l’estimateur est à l’intérieur de l’intervalle de confiance, on conserve l’hypothèse nulle

Si non, on la rejette

25
Q

Quelles sont les conséquences si nous rejetons l’hypothèse nulle?

A
  1. Probabilité de faire une erreur de type 1 supérieure à 5% (trop grand risque)
  2. Risque de faire une erreur de type 2, soit de ne pas rejeter l’hypothèse nulle alors qu’elle est fausse
26
Q

Comment formulé un test statistique en fonction du signal et du bruit ?

A

Statistique testée = signal/bruit

27
Q

V ou F. Plus le bruit (erreur) est faible, plus la statistique testée sera grande et risquera d’être statistiquement significative

A

VRAI

28
Q

V ou F. Plus le signal (effet) est faible, plus la statistique testée sera grande et risquera d’être statistiquement significative.

A

FAUX

Plus le signal (effet) est GRAND, plus la statistique testée sera grande et risquera d’être statistiquement significative.