MODULE 5 Flashcards

1
Q

L’amplitude de la réponse s’obtient de quelle façon?

A

L’amplitude de la réponse s’obtient en comparant les mesures de tendance centrale (proportion, moyenne, ou médiane) des distributions

À noter que l’amplitude de la réponse varie d’une simulation à l’autre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Le théorème central limite nous donne quoi à l’aide d’un seul ECR?

A

Le théorème central limite nous donne une approximation de l’histogramme avec un seul ECR

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Les distributions nous permettent quoi?

A

D’observer des valeurs sous une hypothèse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce qu’une probabilité conditionnelle?

A

La probabilité d’observer un événement (ex : une différence de 20% ou plus) sous une conditions (ex : les incidences cumulées sont égales dans les deux groupes)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

VRAI OU FAUX : L’histogramme est une distribution de probabilité

A

FAUX
L’histogramme donne un aperçu de la forme de la distribution, mais ce n’est pas une distribution de probabilité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Pourquoi est-ce que la probabilité d’obtenir une valeur spécifique est de 9?

A

Étant donné qu’il y a une infinité de valeur possible. Ceci peut sembler paradoxal où la probabilité d’observer n’importe quelle valeur spécifique sur le support est 0, mais la probabilité d’observer une valeur dans un intervalle est non nulle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Le calcul de la probabilité sur fait sur quoi?

A

Sur des intervalles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

L’aire sous la courbe d’une distribution représente quoi?

A

Une probabilité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Les distributions de probabilités avec des supports continues sont des?

Les distributions de probabilités avec des supports discrets sont des?

A

Les distributions de probabilités avec des supports continues sont des courbes

Les distributions de probabilités avec des supports discrets ne sont pas des courbes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelle variable peut être centrée et réduite?

A

Toute variable X distribuée selon une loi normale N (u, sigma^2) peut-être centrée et réduite

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelle formule utilise-t-on pour centrée et réduire une variable?

A

Z = (x-u)/sigma où Z suit une N(0,1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Est-ce que u et sigma sont connus?

A

En pratique, u et sigma sont inconnus et on doit les estimer à partir des données de l’étude. On utilise donc la moyenne et l’écart-type observés dans l’échantillon qui se note x (avec barre au-dessus) et s

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

De quelle façon les paramètres de la loi normale influencent-ils la forme de la cloche?

A

Quand u varie, la cloche bouge de gauche à droite

Quand sigma varie, la cloche bouge de haut en bas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

La concentration des observations autour de la moyenne d’une loi normale N(u, variance) est :

A

-environ 68% des observations sont situées entre : u-variance et u+variance

-environ 95% des observations sont situées entre u-2variance et u+2ariance

-environ 99% des observations sont situées entre u-3variance et u+3 variance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce qui détermine le type de distribution utilisé?

A

Les statisticiens utilisent d’autres distributions continues en fonction de la nature de la variable, du design de l’étude et du type de réponse désirée (comparaison de moyennes, rapport, etc)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce que la loi du Chi-carré?

A

Cette distribution s’obtient par l’addition de carré de variables suivant la loi normale. Elle est utilisée, entre autre, pour l’analyse des tableaux de contingence.

Par exemple, si X1 et X2 sont des variables indépendantes suivant chacune une loi N (0,1) alors X1^2 + X2^2 aura une distribution du Chi-carré

17
Q

Qu’est-ce que la loi de Student?

A

Lorsque n>30, cette loi est très similaire à la loi normale.

Par exemple, lorsque n=100, la probabilité d’observer un événement à plus de +/-sigma est 0.3174 et 0.3197 pour la loi normale et de Student, respectivement.

Dans le contexte des ECRs où le nombre de participants (n) est généralement grand, l’approximation normale est excellente. On utilise la loi de Student surtout lorsque les tailles d’échantillons sont <30

18
Q

Qu’est-ce que la loi de Fisher?

A

Cette loi s’obtient en divisant deux variables suivant la loi du Chi-carré. Elle est donc associée à la loi normale puisque la loi du Chi-carré découle de la loi normale. La loi du Fisher est surtout utilisée dans la comparaison de plusieurs moyennes (>2 groupes)

19
Q

Quels sont les 3 présupposés pour que le théorème central limite s’applique?

A

Indépendance
-le résultat sur un participant ne donne aucune information sur le résultat d’un autre participant. Ce présupposé serait violé si on effectuait, par exemple, un ECR sur des jumeaux. Le résultat pour un des jumeaux ajouterait de l’information sur le résultat de l’autre (puisqu’ils sont génétiquement similaires)

Identiquement distribué
-la variable X a la même distribution pour tous les participants de l’étude

N grand
-selon la distribution de X, l’approximation est bonne pour des n aussi petits que 12. La distribution de X est très loin d’une loi normale alors > ou = à 100 est nécessaire. Donc pour la majorité des ECRs, le TCL pourra s’appliquer puisque les tailles d’échantillons sont bien souvent >100

20
Q

Le TCL concerne seulement la distribution de quoi?

A

Le TCL concerne seulement la distribution de la moyenne

C’est en utilisant ces deux principes que le théorème central limite est démontré pour la distribution de la moyenne. En effet, la moyenne est une variable aléatoire qui peut être calculée à partir d’un grand nombre d’observations, et donc, la loi des grands nombres permet de montrer que la moyenne converge presque sûrement vers l’espérance de la variable aléatoire.

Ensuite, la convergence en loi permet de montrer que la distribution de la moyenne converge vers une distribution normale, sous certaines conditions. Ces conditions sont généralement liées à la taille de l’échantillon et à la variance de la variable aléatoire.

En revanche, le théorème central limite ne s’applique pas directement à la distribution d’autres statistiques, telles que la médiane, l’écart-type ou la variance. Cela est dû au fait que ces statistiques ne sont pas des moyennes d’échantillons, et donc ne peuvent pas être dérivées directement de la loi des grands nombres.

21
Q

Le TCL concerne seulement la distribution de la moyenne. La réponse à la question de recherche concerne la différence entre 2 groupes. Pourquoi est-ce que ceci ne pose pas de problème?

A

Car la différence (ou la somme) de lois normales indépendantes est une loi normale.

Si on veut répondre à une question de recherche qui porte sur la différence entre deux groupes (par exemple, deux proportions), on peut être amené à additionner ou soustraire deux lois normales indépendantes.

Heureusement, la somme ou la différence de deux lois normales indépendantes est également une loi normale, et donc, on peut appliquer le théorème central limite à cette situation. Cela signifie que si l’on veut étudier la différence entre deux groupes qui suivent des distributions normales, on peut utiliser le théorème central limite pour approximer la distribution de cette différence comme étant également une loi normale.

Cependant, il est important de noter que le théorème central limite n’est pas applicable à toutes les situations statistiques. Par exemple, si les distributions des deux groupes ne suivent pas une loi normale, il peut être nécessaire d’utiliser d’autres méthodes statistiques pour répondre à la question de recherche.

22
Q

VRAI OU FAUX : Les variances s’additionnent

A

VRAI

23
Q

Que stipule le TCL?

A

Il stipule que la moyenne de la distribution de probabilité de plusieurs échantillons aléatoires suit une distribution normale, à condition que le nombre d’observations soit suffisamment grand.

24
Q

VRAI OU FAUX : Il faut une distribution de X précise pour pouvoir approximer la distribution de la moyenne par une loi normale?

A

FAUX
Peu importe la distribution de X, on peut approximer la distribution de la moyenne par une loi normale.

Par exemple, la distribution initiale dans la simulation est une loi discrète appelée la loi binomiale. Cette loi est définie par un paramètre seulement : le paramètre p. La simulation des 1000 ECRs a été effectuée avec cette distribution où pour chacun des participants, il y avait une probabilité p d’observer l’événement (1 si on observe l’événement, 0 sinon). Une valeur de p = 0.20 a été utilisée pour les deux groupes simulés. Donc la distribution de la variable initiale X est très différente d’une loi normale (de plus c’est une variable avec une distribution discrète qui n’assume que 2 valeurs : 0 et 1). Mais la différence des deux proportions, Ce − Cp peut s’approximer par une loi normale en vertu du TCL. Ceci explique que l’histogramme des 1000 simulations est en forme de cloche.

25
Q

Définir écart-type

A

La dispersion d’une variable X dans une population est l’écart-type

26
Q

Définir erreur-type :

A

La dispersion d’une variable X associée à la moyenne

27
Q

Comment est-ce que l’erreur type peut être influencée par l’échantillon?

A

L’erreur-type peut être très petite et à la limite égale à 0 si n est très grand.

Avec un recensement, SE = 0. Donc plus on ajoute de participants, plus on s’approche d’un recensement, plus on s’approche de 0

28
Q

Si on fait un recensement, quelle est la valeur de l’erreur-type? Pourquoi?

A

En fait, la formule exacte de l’erreur-type est : (σ/√n) × √ (N−n)/(N−1) où N est la taille de la population.

Le terme ajouté s’appelle un facteur de correction pour population finie. On note que si n = N (un recensement de la population entière), l’erreur-type est nulle car le facteur de correction est égale à 0. Dans le contexte d’un ECR, les recensements de la population au complet sont non éthiques et non réalisables. De plus, dans la majorité des cas n «&laquo_space;N , si bien que √ (N−n)/(N−1) ≈ 1. Alors la correction est ignorée dans le contexte des ECRs. La majorité des logiciels statistiques ignorent le facteur de correction pour population finie

29
Q

Est-ce que u et x (moyenne) possèdent une distribution?

A

U non, car valeur fixe
X (moyenne) oui, car distribution

30
Q

Avec le paradigme fréquentiste u est quoi?

A

Fixe, mais inconnu. Le u n’a pas de distribution

31
Q

À quoi sert la technique de ré-échantillonnage?

A

Certaines techniques modernes ont été développées pour obtenir des intervalles de confiance dans un contexte où le TCL ne s’applique pas.

Le ré-échantillonnage est semblable à la simulation de 1000 ECRs sauf qu’on utilise les données observées de l’ECR pour créer la simulation (au lieu de fixer les paramètres et la loi de distribution)

32
Q

Qu’est-ce que le paradigme fréquentiste?

A

Selon le paradigme fréquentiste, la distribution de la réponse possède des paramètres inconnus, mais fixes.

Lorsqu’on réalise un ECR, on obtient des estimations de ces paramètres.

33
Q

Chez un fréquentiste, quelle est la probabilité d’un événement?

A

Chez un fréquentiste, la probabilité d’un événement est sa fréquente relative d’occurence en répétant l’expérience un grand nombre de fois (à l’infini)

34
Q

Qu’est-ce que le paradigme bayésien?

A

Selon le paradigme bayésien, les paramètres ne sont pas fixes et ont eux-mêmes une distribution inconnue

35
Q

Chez un bayésien, on doit assigner quoi a priori?

A

Chez un bayésien, on doit assigner a priori une mesure du degré de croyance (ou d’incertitude) à un événement. Cette mesure est basée sur l’information que nous avons sur le phénomène étudié.