Cours 2 Flashcards

1
Q

Qu’est-ce que la distribution gaussienne?

A

Distribution normale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

VRAI ou faux

À peu près tous les phénomènes suivent la distribution normale, mais on ne sait pas pourquoi

A

VRAI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

VRAI ou FAUX.

Les données doivent se distribuer sur la distribution normale pour faire les calculs statistiques habituels.

A

FAUX
Les données ne doivent pas se distribuer parfaitement sur la distribution normale pour faire les calculs statistiques habituels.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Lorsque la moyenne et l’écart-type sont connus, on peut calculer la probabilité […]

A

Lorsque la moyenne et l’écart-type sont connus, on peut calculer la probabilité d’observer une valeur dans une étendue déterminé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Les distribution d’échantillonnage suivent, normalement, la distribution […] ce qui en fait un élément central des principes d’analyses statistiques

A

Les distribution d’échantillonnage suivent, normalement, la distribution normale ce qui en fait un élément central des principes d’analyses statistiques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce que le “coeur de la statistique”?

A

La variabilité interéchantillonnage

-> Nous permet de faire des inférences statistiques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce que la distribution normale

A

Les distributions de probabilité rapportent la densité en fonction des valeurs prises

  • > C’est l’aire sous la courbe qui correspond à la probabilité
  • > La distribution normale joue un rôle très important dans la statistique inférentielle
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

VRAI ou FAUX

Il est généralement possible d’assumer la distribution normale

A

VRAI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce qu’une distribution d’échantillonnage?

A

La distribution des valeurs résultant du calcul d’une statistique sur un grand nombre d’échantillons d’une grandeur (N) donnée
-> La plupart des tests statistiques assument que cette distribution suit une courbe normale - c’est la base de la statistique inférentielle

-> Le plus souvent, les paramètres de cette distribution sont inconnus, mais peuvent être estimés à partir d’un échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce que la variabilité interéchantillonnale?

A

Les différences d’un échantillon à l’autre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

L’écart-type de la population d’échantillonnage est toujours connu.

  • > Plus notre échantillon est grand, plus la variabilité autour du paramètre va être […].
  • > Plus l’unité d’observation est grand, plus la courbe va être […] et la probabilité va être […].
A

L’écart-type de la population d’échantillonnage est toujours connu.

  • > Plus notre échantillon est grand, plus la variabilité autour du paramètre va être réduite.
  • > Plus l’unité d’observation est grand, plus la courbe va être normal et la probabilité va être réduite.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

La question à la base de la statistique inférentielle:

Est-ce que les résultats que j’observe sont dû à notre manipulation ou la […]?

A

La question à la base de la statistique inférentielle:
Est-ce que les résultats que j’observe sont dû à notre manipulation ou la variabilité interéchantillonnale?
-> Si la variabilité est au-dessus de la variabilité interéchantionnale, elle est dû à notre manipulation alors il y a un effet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Plus l’échantillon (N) est grand, plus la variance de la distribution d’échantillonnage est […]

A

Plus l’échantillon (N) est grand, plus la variance de la distribution d’échantillonnage est petite
-> Si on avait un échantillon de la grandeur de la population, on aurait aucune variabilité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

VRAI ou FAUX
L’écart-type de la distribution d’échantillonnage est lié directement à l’écart-type de la population et la grandeur de l’échantillon

A

VRAI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quoi faire si on ne connait pas l’écart-type de la population?

A

Utiliser l’écart-type de l’échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

VRAI ou FAUX

L’écart-type de l’échantillon est un informateur biaisé de la population alors on ne peut pas l’utiliser dans nos tests

A

FAUX

L’écart-type de l’échantillon est un informateur non biaisé de la population alors on peut l’utiliser dans nos tests

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est-ce que l’erreur-type?

A

Écart-type de la distribution d’échantillonnage

  • > C’est la base de tous les tests statistiques. On l’estime à partir de l’écart-type de notre échantillon
  • > C’est la variabilité de l’échantillon quantifiée
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Qui est le créateur de l’écart-type?

A

Gausset et sa bière

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Le théorème de la limite centrale dit: plus N est grand et plus la distribution d’échantillonnage s’approche d’une […] et plus les tests inférentiels sont […] et […].

A

Le théorème de la limite centrale dit: plus N est grand et plus la distribution d’échantillonnage s’approche d’une courbe normale et plus les tests inférentiels sont valides et puissants

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Plus N est grand et plus l’estimation est […]

A

Plus N est grand et plus l’estimation est précise

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

VRAI ou FAUX

La distribution d’échantillonnage peut être normale même si les données ne suivent pas une distribution normale

A

VRAI

La distribution d’échantillonnage peut être normale même si les données ne suivent pas une distribution normale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Pour faire les tests statistiques, on a besoin d’un […]

A

Pour faire les tests statistiques, on a besoin d’un estimateur normal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

L’erreur-type permet de quantifier la variabilité […], c’est-à-dire la variabilité naturelle observée entre les échantillons

A

L’erreur-type permet de quantifier la variabilité interéchantillonnale, c’est-à-dire la variabilité naturelle observée entre les échantillons

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Lorsque nous faisons un test d’hypothèse, nous nous demandons si cette variabilité naturelle (due au […]) permet d’expliquer nos résultats où si autre chose que le a eu un effet sur nos données

A

Lorsque nous faisons un test d’hypothèse, nous nous demandons si cette variabilité naturelle (due au hasard) permet d’expliquer nos résultats où si autre chose que le hasard (un traitement, par exemple) a eu un effet sur nos données

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

L’hypothèse de recherche doit être opérationnalisée en hypothèses […]

A

L’hypothèse de recherche doit être opérationnalisée en hypothèses statistiques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Les hypothèses statistiques viennent en […]

A

Les hypothèses statistiques viennent en pair

  • > Le test statistique permet d’estimer la probabilité d’avoir nos résultats si l’hypothèse nulle est vraie
  • > H0 : hypothèse nulle et H1ou Ha: hypothèse alternative
  • > H0 : u1 = u2
  • > H2: u1 =/= u2

u = moyenne de la population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

VRAI ou FAUX

L’hypothèse alternative est conservée jusqu’à ce qu’on ait de bonnes raisons statistiques de la rejeter

A

FAUX
L’hypothèse nulle est conservée jusqu’à ce qu’on ait de bonnes raisons statistiques de la rejeter
-> L’hypothèse nulle est rejetée lorsque le test statistique prend une valeur (trop) improbable

28
Q

VRAI ou FAUX

L’hypothèse nulle correspond à ce que le chercheur veut démontrer

A

FAUX

L’hypothèse alternative correspond à ce que le chercheur veut démontrer

29
Q

Les calculs sont faits sur un échantillon, mais les conclusions du test portent sur la […] (paramètres)

A

Les calculs sont faits sur un échantillon, mais les conclusions du test portent sur la population (paramètres)

30
Q

Lorsque la valeur de l’hypothèse statistique est […] au niveau alpha (a) déterminé par le chercheur, on rejette l’hypothèse nulle et on adopte l’hypothèse alternative

A

Lorsque la valeur de l’hypothèse statistique est inférieur au niveau alpha (a) déterminé par le chercheur, on rejette l’hypothèse nulle et on adopte l’hypothèse alternative
-> Par tradition, le niveau a est fixé à une petite valeur comme a = 0,05 (5%) ou a = 0,01 (1%).

31
Q

VRAI ou FAUX

Le test statistique donne la probabilité que H0 soit vraie.

A

FAUX
Le test ne donne pas la probabilité que Ho soit vraie, le test donne la probabilité d’avoir nos résultats si Ho est vraie

32
Q

Qu’est-ce que l’erreur alpha (a)?

A

Erreur de type 1

  • > Chance que le chercheur se donne de se tromper.
    • > Généralement 5%. Fixé par le chercheur.

“J’aurais dû conclure qu’il n’y avait pas d’effet. J’ai 5% des chances de ne pas retenir H0, et conclure pour H1. Donc de conclure d’un effet significatif lorsqu’il y en ait pas”

33
Q

Qu’est-ce que l’erreur bêta (B)?

A

Erreur de type II
Je conclut à l’absence d’effet (H0) même si en réalité il y en a (H1).
-> La probabilité est généralement non connue puisqu’en général le chercheur va faire un erreur de type 1.

34
Q

Quelle est la probabilité de choisir l’hypothèse alternative alors que l’hypothèse alternative est la bonne?

A

1 - B

  • > 1 - Erreur de type II
  • > C’est la puissance statistique
35
Q

Quelle est la probabilité de choisir l’hypothèse nulle alors que l’hypothèse nulle est la bonne?

A

1 - a

-> 1 - Erreur de type I

36
Q

Qu’est-ce que la puissance statistique?

A

Probabilité de démontrer ce que je veux démontrer, de rejeter H0 si elle est effectivement fausse

  • > 1 - B
    • > 1 - Erreur de type II
37
Q

Quelle est la façon la plus simple d’augmenter la puissance?

A

Augmenter la grandeur échantillonnale

-> PLus de gens = moins de variabilité = moins de chance de faire des erreurs

38
Q

Quelle est la différence principale entre les statistiques baysiennes et les statistiques inférentielles?

A

Les statistiques baysiennes visent à estimer directement la puissance statistique

39
Q

VRAI ou FAUX

Un test significatif ne veut pas dire un effet significatif

A

VRAI

40
Q

VRAI ou FAUX

Une différence peut être statistiquement significative, mais insignifiante

A

VRAI

Ex: Comparer deux diètes qui ont une différence de quelques grammes

41
Q

Lorsqu’une différence statistiquement significative est trouvée, il est souhaitable de quantifier la […] ou la […]

A

Lorsqu’une différence statistiquement significative est trouvée, il est souhaitable de quantifier la grandeur ou la taille de l’effet

42
Q

Quels sont les principes derrière la convergence scientifique? (2)

A

1) Étant donné qu’un pourcentage de tests statistiques donnent des résultats erronés (erreur a), des chercheurs arrivent à des conclusions fausses dans leurs études
2) Certains résultats scientifiques publiés sont erronés

43
Q

Qu’est-ce que la convergence scientifique?

A

Réplication des résultats afin d’arriver à des conclusions scientifiques sûres
-> Les résultats erronés ou dus au hasard ne devraient pas être répliqués ou confirmés.

44
Q

Décrivez les probabilités d’un point de vue analytique

A

Ex: Un sac de caramels mous (15) et durs (85), nous pouvons déterminer analytiquement les probabilités
-> P(dur) = 15/100 = 0.15 = 15%

45
Q

Décrivez les probabilité d’un point de vue fréquentiste

A

Établissement des probabilités par essais répétés

ex: Je tire un caramel, je note le type et je répète

46
Q

Qu’est-ce qu’un évènement?

A

Concept central des probabilités

“Quelque chose qui se produit”

47
Q

Qu’est-ce qu’un évènement indépendant?

A

L’occurrence d’un évènement qui n’affecte pas la probabilité d’un autre évènement

48
Q

Qu’est-ce qu’un ensemble exhaustif des évènements?

A

Tous les résultats possibles à une action

Ex: Lancer un dé : {1, 2, 3, 4, 5, 6}

49
Q

Qu’est-ce qu’un évènement mutuellement exclusif?

A

L’occurrence d’un événement exclut l’autre événement

50
Q

Quelles sont les lois fondamentales des probabilités? (4)

A

1) Loi additive
2) Loi multiplicative
3) Tirage avec remise
4) Probabilité conditionnelle

51
Q

Qu’est-ce que la loi additive?

A

Si deux événements sont mutuellement exclusifs, la probabilité de l’un ou de l’autre est la somme des probabilité
-> P (A ou B) = P (A) + P (B)

52
Q

Qu’est-ce que la loi multiplicative?

A

La probabilité d’occurrence conjointe de deux événements est la multiplication des probabilités
-> P (A et B) = P (A) * P (B)

53
Q

Qu’est-ce qu’un tirage avec remise?

A

À chaque essai, je remets l’item dans le sac
-> Le fait de faire un essai ne change pas la probabilité d’occurrence des autres événements - les événements demeurent indépendants

54
Q

Qu’est-ce qu’une probabilité conditionnelle?

A

La probabilité d’un événement étant donné un autre

-> P (A|B) : Probabilité de A étant donné B

55
Q

Qu’est-ce qu’une permutation?

A

Tous les arrangements possibles du nombre d’éléments choisis dans l’ensemble, étant donné que chaque élément est choisi au hasard, sans remise

Ex: choisir trois éléments de {A, B, C}, (r = 3, N =3):
ABC ACB BAC BCA CAB CBA -> Il y a 6 permutations

-> C’est l’équation avec !

56
Q

Qu’est-ce qu’une combinaison?

A

Tous les arrangements possibles, sans tenir compte de l’ordre des éléments, étant donné que chaque élément de l’ensemble est choisi au hasard, sans remise

Ex: choisir deux éléments parmi {A, B, C} (r = 2, N = 3)
AB AC BC -> Il y a 3 combinaisons

57
Q

Pourquoi l’approche bayésienne gagne en popularité? (2)

A

1) Elle ne présuppose pas la distribution normale
2) Elle permet d’estimer des probabilités qui sont inconnues avec l’approche inférentielle - notamment la probabilité que H0 soit vraie (permet de trouver la puissance d’effet)
3) Avec le théorème de Bayes, on part avec une mesure d’estimation. Lorsqu’on arrive à un bon estimé, on peut arrêter de collecter de nouvelles données -> Donc pas besoin de décider la grandeur d’échantillon

-> Elle est toutefois beaucoup plus complexe d’un point de vue computationnel et mathématique

58
Q

VRAI ou FAUX

L’approche fréquentiste demeure dominante

A

VRAI

59
Q

Le théorème de Bayes nous indique comment modifier les probabilités à mesure que l’on accumule de […]
-> p.e. changer l’estimation de la probabilité que […] soit vrai à mesure que l’on obtient de nouvelles données

A

Le théorème de Bayes nous indique comment modifier les probabilités à mesure que l’on accumule de l’information
-> p.e. changer l’estimation de la probabilité que Ho soit vrai à mesure que l’on obtient de nouvelles données

60
Q

Avec le théorème de Bayes, il faut d’abord définir une probabilité à […]– cette probabilité peut être subjective, soit analytique – p.e. la probabilité que […] soit vraie : p(A), puis étant donné un N résultats empiriques, le théorème permet d’estimer la probabilité […] p(A|N), c’est dire la probabilité que Ho soit vraie étant donné les N résultats empiriques

A

Avec le théorème de Bayes, il faut d’abord définir une probabilité à priori – cette probabilité peut être subjective, soit analytique – p.e. la probabilité que Ho soit vraie : p(A), puis étant donné un N résultats empiriques, le théorème permet d’estimer la probabilité conditionnelle p(A|N), c’est dire la probabilité que Ho soit vraie étant donné les N résultats empiriques

61
Q

Dans le théorème de Bayes, P(N|A) est la probabilité de “non […]”, c’est-à-dire la probabilité de l’hypothèse […]. Or, cette probabilité est généralement inconnue et difficile à estimer

A

Dans le théorème de Bayes, P(N|A) est la probabilité de “non A”, c’est-à-dire la probabilité de l’hypothèse alternative. Or, cette probabilité est généralement inconnue et difficile à estimer

62
Q

La distribution binomiale traite des situations où des essais donnent un résultat
parmi deux résultats mutuellement […] (p.e. lancer une pièce: pile ou face) - découle du schéma de Bernoulli

A

La distribution binomiale traite des situations où des essais donnent un résultat
parmi deux résultats mutuellement indépendants (p.e. lancer une pièce: pile ou face) - découle du schéma de Bernoulli

63
Q

La distribution binomiale est une distribution […] et non […].

A

La distribution binomiale est une distribution discrète et non continue.

64
Q

Le forme de la distribution binomiale change en fonction de N ([…]) et de p ([…]) , pour les grands N, la binomiale tend vers une distribution […]

A

Le forme de la distribution binomiale change en fonction de N (nombre d’essais) et de p (prob. de succès) , pour les grands N, la binomiale tend vers une distribution normale

65
Q

La distribution binomiale utilise le test du […]

A

La distribution binomiale utilise le test du signe

66
Q

Le test du signe est très pratique, car il ne postule pas que les données suivent la […]

A

Le test du signe est très pratique, car il ne postule pas que les données suivent la distribution normale…
-> La distribution binomiale peut être généralisée au cas où l’on désire calculer la probabilité d’obtenir plusieurs événements simultanés, c’est la distribution multinomiale