Cours 2 - Distribution, Échantillonnage, Probabilités Flashcards

1
Q

Question sur les degrés de libertés : Est-ce qu’on peut les appliquer aux statistiques descriptives?

A

Non, lorsque c’est inférentiel on perd des degrés de libertés mais lorsque c’est avec la population on ne perd pas de degrés de libertés puisqu’on comprend qu’on a déjà toutes les informations sur la population.

Si les degrés de libertés ne s’applique pas, pourquoi la formule de variance fait-elle perdre un degré de liberté? C’est parce qu’on vise toujours à ESTIMER les paramètres de la populations avec ce genre de formule (donc c’est en lien avec les estimateurs, l’échantillon, etc etc)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

La distribution normale gaussienne - Moyenne, mode et médiane sont ils égaux?

A

Oui, c’est une particularité de la distribution normale gaussienne. Les trois sont égaux dans cette distribution. Elle est aussi symétrique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Distribution normale - Beaucoup de phénomènes peuvent-ils être expliqués par celle-ci?

A

Oui, on assume que beaucoup de phénomènes se distribuent selon la courbe normale (QI par exemple). On voit même des sous-phénomènes ou des sous-groupes qui répondent à ceci.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Distribution normale - Distribution d’échantillonnage

A

Les distributions d’échantillonnage suivent, le plus souvent, une distribution normale ce qui en fait un élément central des principes de la statistique inférentielle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Peut-on généralement assumer une distribution normale?

A

OUÉ

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Deux paramètres populationnels de la distribution normale?

A

μ et sigma

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Dans lfond t’es tu capable d’utiliser la formule de la cote Z pour trouver une probabilité?

A

Oui si t’es pas nono sinon z = X -μ / sigma

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Utilisation du tableau pour le score Z - WARNING

A

Toujours faire attention d’utiliser la plus petite portion OU la plus grande portion (selon le cas), quand même tannant comme erreur d’inattention qui te vole ton A+

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

C’est quoi une distribution d’échantillonnage? **QUESTION D’EXAMEN RETIENT ÇA PAR COEUR COMME SI TA VIE EN DÉPEND

A

La distribution des valeurs résultant du calcul d’une
statistique sur un grand nombre d’échantillons d’une grandeur (N)
donnée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Réflexion derrière la distribution d’échantillonnage

A

On a un échantillon composé d’unité d’observation. À partir de cet échantillon, on prend des estimateurs pour estimer les paramètres de la population. On ne peut pas faire cela directement, il faudra donc une distribution d’échantillonnage. Il faut comparer les valeurs de l’échantillon à celle des valeurs de la distribution de l’échantillonnage qui pourra ensuite faire une inférence sur les paramètres de la population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Autre manière de voir la distribution d’échantillonnage ;

A

C’est une distribution dérivée mathématiquement, créée à partir de construits mathématiques (comparé à construits empiriques par exemple) sur une statistique d’intérêt donné sur un grand nombre d’échantillon (un nombre d’échantillon quasi-infini) d’un nombre ‘n’ donné. Chaque échantillon doit donc avoir la même grandeur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Combien d’unités d’observation faut-il pour que la distribution d’échantillonnage ait une forme normale

A

30 unités d’observation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Explication empirique de la distribution d’échantillonnage

A

*** En se fiant à l’image de la diapo 13

Gros cercle = population. On veut mesurer leur stress sur 10.

Pour des raisons X, on a pas accès à la population, juste des échantillons.

On prend l’échantillon x1, qui a une moyenne de 4/10.

On prend un autre échantillon x2, qui a une moyenne de 6/10

On répète ce processus là encore et encore jusqu’à ce que les possibilités de 4 personnes soient épuisées. La même personne va revenir plusieurs fois, mais avec d’autres personnes. Environ 4845 échantillons possibles.

On va donc créer une distribution avec nos échantillons

Si on a la moyenne de la distribution d’échantillonnage, on aura une moyenne pratiquement similaire que la population

***Ce qui est magique avec les stats, on pourra inférer comment les statistiques se distribuent dans la population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Relation entre la grandeur de l’échantillon et la variance de la distribution d’échantillonnage

A

Plus l’échantillon (N) est grand, plus la variance de la distribution
d’échantillonnage est petite ;

Plus l’ÉT est petit, plus on comprend que la moyenne est représentative de la population.

Donc, plus l’échantillon est grand, plus la variance de la distribution de l’échantillon sera petit. Plus l’échantillon est grand, plus les données vont se regrouper autour de la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Théorème de la limite centrale - Définition

A

plus N est grand et plus la distribution d’échantillonnage s’approche d’une courbe normale et plus les tests inférentiels sont valides et puissants

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce que la puissance statistique?

A

La capacité de tester ce qu’on veut vraiment tester

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Est-ce que la distribution d’échantillonnage peut être normale si les données ne suivent pas une distribution normale?

A

Oui!

18
Q

À quoi sert l’erreur type?

A

Quantifier la variabilité interéchantillonnale (variabilité naturelle observée entre les échantillons)

19
Q

Pourquoi faire des tests d’hypothèse?

A

Car l’hypothèse de recherche doit être opérationnalisée en hypothèses statistiques (H0 et H1)

20
Q

Qu’est-ce que permet de faire le test statistique?

A

Estimer la probabilité d’avoir nos résultats si l’hypothèse nulle est vraie

21
Q

Vrai ou faux? Si la probabilité est inférieure au niveau alpha déterminé, on rejette H0 et on adopte H1.

A

Vrai. La convention disait avant qu’on mettait p plus petit que .05, mais maintenant on met ‘p = vraie valeur du test’
***le test ne donne pas la probabilité que Ho soit vraie, le test
donne la probabilité d’avoir nos résultats si Ho est vraie

22
Q

Critique du système de décision / Erreurs statistiques (erreurs de type 1 ou 2)

A

Si on rejette l’hypothèse alternative, ça ne veut pas nécessairement dire que l’hypothèse nulle est vraie. Si on a un résultat significatif, on aurait tendance à dire que l’hypothèse nulle est fausse, ce qui n’est pas nécessairement vrai. De plus, le système propose une pensée dichotomique; un côté bon, un côté mauvais dans la situation. Ce n’est pas logique avec la mentalité des probabilités.

23
Q

C’est quoi la valeur de la puissance statistique?

A

1-bêta. Généralement inconnue et difficile à estimer

24
Q

Grandeur d’effet - effet significatif

A

Un test significatif ne veut pas dire un effet signifiant
EX: une différence statistiquement significative dans la
diminution de symptômes associée à deux médicaments, mais qui
serait de quelques milligrammes

Si on trouve un effet significatif, il est souhaitable de quantifier la grandeur d’effet

25
Q

Familles de tailles d’effets (4)

A
  • η2 êta carré ou partiel ; valeur de 0 à 1. Plus c’est proche de 1, plus on explique la variance de la VD
  • F et d de cohen;
  • ω2 ou oméga-carré.
  • r Corrélation de pearson : -1 à 1. Indice de la force de la relation entre deux variables. Si on veut parler du pourcentage de variance, c’est r carré qu’on prend.
26
Q

Convergence scientifique - Définition

A

Certains chercheurs publient des résultats positifs erronés (erreur alpha), la réplication des résultats permet d’assurer la convergence scientifique (assurance de développer une connaissance juste)

27
Q

C’est quoi une probabilité?

A

QUESTION PIÈGE!!! C’EST DIFFICILE À DÉFINIR / y’a plusieurs points de vue

Analytique : exemple caramels mous et durs, P(dur) = 15/100
Fréquentistes : Probabilités par essais répétés avec décompte

28
Q

Plus le nombre d’essais est grand, plus l’estimation des probabilités est précise. Vrai ou faux?

A

VRAI, si N = ∞ : probabilités réelles

29
Q

Les humains sont-ils bon pour estimer les probabilités???

A

No we suck en criss. La probabilité subjective fait référence à ça, c’est la croyance qu’un individu a dans la probabilité d’occurrence d’un événement

30
Q

C’est quoi un événement?

A

Le psycolloque

31
Q

C’est quoi réellement un événement?

A

Un concept central des probabilités qui fait référence à la situation, la circonstance, etc. C’est quelque chose qui se produit.

32
Q

Événements indépendants, ensemble exhaustif des événements et événements mutuellement exclusif - définition

A

Indépendants - Si un arrive, cela n’affecte pas l’autre (les chances que tu bois un litre de jus d’orange n’affecte pas les chances que la lune tombe du ciel)
Ensemble exhaustif - tous les résultats possibles à une action (lancer un dé ; 1,2,3,4,5,6)
Événements mutuellement exclusif : Occurrence d’un événement exclut l’autre événement. Lancer une pièce, pile exclut face / Aller au psycolloque avec Will et Jacob comme chef de deleg, ul exclut la possibilité de perdre

33
Q

Lois fondamentales des probabilités (4)

A

1 - Loi additive
2 - Loi multiplicative
3 - Tirage avec remise
4 - Probabilité conditionnelle

34
Q

Loi additive - défintion

A

Si 2 événements sont mutuellement exclusifs, la probabilité de l’un ou de l’autre est la somme des probabilités
P(A ou B) = P(A) + P(B)

35
Q

Loi multiplicative - définition

A

Probabilité d’occurrence conjointe de 2 événements est la multiplication des deux probabilités P(A ET B) = P(A) * P(B)

36
Q

Tirage avec remise - définition

A

Le fait de faire un essai ne change pas la probabilité d’occurrence des
autres évènements – les événements demeurent indépendants

37
Q

Probabilité conditionnelle - Définition

A

Probabilité d’un événement étant donné un autre
Ex : La probabilité de gagner le psycolloque en fonction des chefs de delegation (bad bros / pas les bad bros)

38
Q

Permutation - Définition

A

Tous les arrangements possibles d’un nombre d’éléments choisis SANS remise mais en tenant compte de l’ordre

Le nombre de permutations d’un ensemble est le nombre de “mélanges” que l’on peut effectuer sur cet ensemble.

39
Q

Combinaison - Définition

A

Tous les arrangements possibles, sans tenir compte de
l’ordre des éléments
, étant donné que chaque élément de l’ensemble est choisi au hasard, sans remise

40
Q

Différence entre permutation et combinaison

A

Le nombre de combinaisons d’un ensemble est le nombre de possibilités d’avoir k éléments parmi n éléments (sans prendre en compte l’ordre, sans répétition).
Combien de binômes peux-tu former dans une classe de 32 ?

Le nombre de permutations d’un ensemble est le nombre de “mélanges” que l’on peut effectuer sur cet ensemble.
Combien de jeux avons-nous dans un paquet de 54 cartes ?

41
Q

Théorème de Bayes - 2 raisons de sa popularité

A
  1. Elle ne présuppose pas la distribution normale
  2. Elle permet d’estimer des probabilités qui sont inconnues avec
    l’approche inférentielle – notamment la probabilité que Ho soit
    vraie

Même si elle devient de + en + populaire, l’approche fréquentiste demeure dominante car Bayes est très complexe

42
Q

Distribution binomiale - ça fait quoi dans lfond

A

Traite des situations où des essais donnent un résultat parmi deux
résultats mutuellement indépendants (genre lancer une pièce: pile
ou face) - découle du schéma de Bernoulli

C’est une distribution discrète, pas continue