Cours 12 Flashcards

1
Q

Qu’est-ce que la distribution d’échantillonnage?

A

La distribution des valeurs résultant du calcul d’une statistique sur un grand nombre d’échantillons d’une grandeur donnée (N)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

La plupart des tests statistiques assument que la distribution […] suit une courbe normal - C’est la base de la statistique inférentielle

A

La plupart des tests statistiques assument que la distribution d’échantillonnage suit une courbe normal - C’est la base de la statistique inférentielle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

VRAI ou FAUX

Le plus souvent, les paramètres de la distribution d’échantillonnage sont connus.

A

FAUX
Le plus souvent, les paramètres de la distribution d’échantillonnage sont inconnus, mais peuvent être estimés à partir d’un échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Nos hypothèses sont toujours en fonction de la variabilité de l’[…], variabilité du […], variabilité caractéristique de la distribution d’échantillonnage.

A

Nos hypothèses sont toujours en fonction de la variabilité de l’erreur, variabilité du hasard, variabilité caractéristique de la distribution d’échantillonnage.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Même si on ne connaît pas les paramêtres de la distribution d’échantillonnage, pourquoi peut-on faire des statistiques inférentielles avec cette distribution?

A

Car on connaît la forme de la distribution normale.
Puisque les phénomènes naturels se déplacent selon une loi normale, on assume que la distribution d’échantillonnage respecte la normalité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Le calcul différentiel et les lois statistiques nous permettent d’affirmer plusieurs choses dont le fait que la […] et l’[…] de la distribution d’échantillonnage est la même que la population.

A

Le calcul différentiel et les lois statistiques nous permettent d’affirmer plusieurs choses dont le fait que la moyenne et l’écart-type de la distribution d’échantillonnage est la même que la population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

VRAI ou FAUX

La distribution d’échantillonage a toujours les mêmes modalités

A

VRAI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Plus l’échantillon (N) est grand, plus la variance de la distribution d’échantillonnage est […]

A

Plus l’échantillon (N) est grand, plus la variance de la distribution d’échantillonnage est petite

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Que permet l’erreur-type?

A

L’erreur-type permet de quantifier la variabilité interéchantillonnale, c’est-à-dire la variabilité naturelle observée entre les échantillons

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Lorsque nous faisons un test d’hypothèse paramétrique, nous utilisons (généralement) la distribution […] pour caractériser la variabilité interéchantillonnale

A

Lorsque nous faisons un test d’hypothèse paramétrique, nous utilisons (généralement) la distribution normale pour caractériser la variabilité interéchantillonnale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Pourquoi on n’utilisait pas les statistiques baysiennes avant les dernières années?

A

Pas d’ordinateur suffisamment puissant pour faire les calculs requis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quel est le désavantage des tests non paramétriques?

A

Ils sont beaucoup moins puissant (erreur de type 1: 1-b)
-> Puisqu’on ne connaît pas la distribution d’échantillonnage, on prend des tests ultra conservateurs pour éviter l’erreur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quand on utilise pas la distribution normale, on utilise des tests […]

A

Quand on utilise pas la distribution normale, on utilise des tests non paramétriques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que les tests paramétriques?

A

Tests statistiques permettant de faire des inférences sur la population lorsque les caractéristiques de la distribution d’échantillonnage sont connues (généralement une
distribution normale)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Pour utiliser les tests paramétriques, nous devons connaître l’[…] de la distribution […] (l’erreur-type) ou du moins être capable de l’estimer à partir des données d’échantillonnage

A

Pour utiliser les tests paramétriques, nous devons connaître l’écart-type de la distribution d’échantillonnage (l’erreur-type) ou du moins être capable de l’estimer à partir des données d’échantillonnage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Les tests paramétriques fonctionnent grâce au théorème de la […]

A

Les tests paramétriques fonctionnent grâce au théorème de la limite centrale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Que postule le théorème de la limite centrale?

A

1) Plus N (taille de l’échantillon) est grand et plus la distribution d’échantillonnage se rapproche d’une distribution normale
2) Plus N est grand et plus la variabilité de la distribution d’échantillonnage (erreur-type) est petite
* * L’erreur-type est l’écart-type de la distribution normale/la racine carré de la taille de l’échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Qu’est-ce que les tests non paramétriques?

A

Tests statistiques qui ne demandent pas que la forme et les paramètres de la distribution d’échantillonnage soient connus
-> Nous parlons de tests indépendants de toute
distribution

19
Q

VRAI ou FAUX

Les tests non paramétriques sont moins puissants (1-B), la probabilité de conserver erronément l’hypothèse null

A

FAUX
Les tests non paramétriques sont moins puissants (1-B), donc diminue la probabilité de conclure correctement sur l’hypothèse alternative (ce que je veux démontrer)

20
Q

On fait des tests non paramétriques seulement lorsqu’on ne peut pas assumer que la distribution d’échantillonnage est […] ou qu’elle est complètement […]

A

On fait des tests non paramétriques seulement lorsqu’on ne peut pas assumer que la distribution d’échantillonnage est normale ou qu’elle est complètement inconnue

21
Q

Qu’est-ce que le ré-échantillonnage de Effron?

A

Technique computationnelle qui permet d’estimer la forme et les caractéristiques de la distribution d’échantillonnage sans postuler une distribution particulière
-> Il s’agit d’estimer le paramètre qui nous intéresse un grand nombre de fois à partir de tirages répétés d’un grand nombre « d’échantillons »

22
Q

VRAI ou FAUX

Avec le ré-échantillonnage, nous ne disposons que d’un seul échantillon représentatif de la population

23
Q

Que vise la procédure de ré-échantillonnage?

A

Vise à créer un grand nombre de “nouveaux” échantillons en faisant des tirages aléatoires avec remise à partir de notre échantillon

24
Q

Avec le ré-échantillonnage, notre échantillon forme une […]

A

Avec le ré-échantillonnage, notre échantillon forme une pseudo-population

25
Q

Avec le ré-échantillonnage, en faisant des tirages […], nous créons un grand nombre de pseudo-échantillons qui permettent d’estimer la statistique un grand nombre de fois et de reproduire la distribution d’[…]

A

Avec le ré-échantillonnage, en faisant des tirages avec remise, nous créons un grand nombre de pseudo-échantillons qui permettent d’estimer la statistique un grand nombre de fois et de reproduire la distribution d’échantillonnage

26
Q

VRAI ou FAUX
Avec le ré-échantillonnage, la variabilité entre mes pseudos échantillons va être comparable à celle entre des échantillons complètement différent.

27
Q

Avec le ré-échantillonnage, la distribution de mes échantillons pseudo va ressembler à la distribution […].

A

Avec le ré-échantillon, la distribution de mes échantillons pseudo va ressembler à la distribution normale.

28
Q

Avec le ré-échantillonnage, la variabilité entre mes pseudos échantillonnale va correspondre à ma variabilité interéchantillonnale. Pourquoi?

A

La variabilité interéchantillonnale est reproduite, car ce ne sont pas les mêmes unités d’observation qui constituent chacun des pseudo-échantillons (à cause des remises)

29
Q

Avec le ré-échantillonnage, il faut que notre échantillon soit très bon et très […] de la population. Pourquoi

A

Avec le ré-échantillonnage, il faut que notre échantillon soit très bon et très représentatif de la population

-> Mais, chaque fois que l’on pige une unité, nous puisons dans un sous ensemble représentatif de la population, de ce fait les pseudo-échantillons sont représentatifs de la population

30
Q

Ré-échantillonnage
Les […] de la distribution de ré-échantillonnage permettent de calculer des intervalles de confiance et de faire des tests statistiques

A

Les percentiles de la distribution de ré-échantillonnage permettent de calculer des intervalles de confiance et de faire des tests statistiques

31
Q

Pourquoi la méthode de ré-échantillonnage utilise les percentiles?

A

Quand on faisait les tests T, on prenait le niveau alpha.
-> On se demandait si notre valeur de notre test était plus grand que le t critique (et donc plus petit que l’alpha prédéterminé).

Les percentiles me permettent de trouver la valeur à un certain percentile pour trouver les valeurs critiques de mon test car si on classe les résultats en ordre, on peut le situer clairement.
-> Pas besoin d’estimer comme avec les tests t.

32
Q

Pour calculer l’intervalle de confiance avec un niveau alpha de 5% dans une distribution bilatérale, nous utilisons les percentiles: [ […] - […] ]

A

Pour calculer l’intervalle de confiance avec un niveau alpha de 5% dans une distribution bilatérale, nous utilisons les percentiles: [ 2.5% - 97.5% ]

33
Q

VRAI ou FAUX

L’écart-type de l’approche bootstrap est généralement très près de celle de l’approche paramétrique

A

VRAI
En général, lorsque l’on compare les valeurs d’un test paramétrique et bootstrap, on a presque les même valeurs
-> MAIS seulement lorsque l’échantillon est normal que ça se ressemble! Sinon, on est tout simplement pas capable de faire les tests paramétriques pour les comparer

34
Q

Quels sont les hypothèses statistiques de l’approche bootstrap avec une régression simple?

A

H0: r =0
-> La corrélation observée est égale à zéro et donc dû au hasard
H1: r =/= 0
-> La corrélation observée n’est pas égale à zéro et donc elle n’est pas dû au hasard. C’est une vraie corrélation dans la population/échantillon

35
Q

VRAI ou FAUX
L’approche bootstrap peut être utilisée dans un grand nombre de techniques statistiques et notamment la régression multiple

36
Q

VRAI ou FAUX
L’approche bootstrap est généralement plus puissante (probabilité de démontrer ce que l’on veut démontrer) que les tests non paramétriques “classiques”

37
Q

Quels sont les inconvénients de l’approche bootstrap? (3+1)

A

1) Nécessite un échantillon pleinement représentatif (idéalement probabiliste)
2) Différents essais peuvent donner des résultats différents et (donc) parfois ambigus)
a) Les pseudos échantillon ne sont pas identiques.Donc quand les bootstrap ne fonctionnent pas, certains recommencent jusqu’à ce qu’on est un effet. Parfois, on peut tricher. On devrait peut-être se donner des niveaux alpha plus petits pour éviter ce problème.
3) Ne s’applique pas aux méthodes statistiques plus complexes

38
Q

Quand utilise-t-on des tests non paramétriques?

A

Lorsque les données ne forment pas une distribution normale ou connue.

ex:
1) Des temps de réponses biaisés
2) Des mesures avec un plafond
3) Une échelle de mesure où une valeur particulière est nettement plus fréquente

39
Q

Les tests non paramétriques s’utilisent avec des variables qui prennent un nombre […] de valeurs […] (1. 2. 3. etc)

A

Les tests non paramétriques s’utilisent avec des variables qui prennent un nombre limité de valeurs ordinales (1. 2. 3. etc)

40
Q

Donnez des exemples de tests non paramétriques (3)

A

1) Test de Wilcoxon
2) Test du signe
3) ANOVA de Kruskal-Wallis

41
Q

Qu’est-ce que le Test de Wilcoxon?

A

Équivalent non paramétrique du test-t:

  • > Pour échantillons indépendants
  • > Pour échantillons pariés
42
Q

Qu’est-ce que le test du signe?

A

Équivalent non paramétrique du test-t, mais encore moins puissant que le test de Wilcoxon
-> Basée sur la loi binomiale

43
Q

Qu’est-ce que l’ANOVA de Kruskal-Wallis?

A

Équivalent non paramétrique de l’ANOVA à un facteur de classification

44
Q

Le khi-carré est un test […].

-> C’est le test […] le plus […]

A

Le khi-carré est un test non paramétrique.

  • > C’est le test non paramétrique le plus simple
    • > C’est le test qu’on fait quand on ne sait pas quoi faire d’autre.