Cours 2 - Distribution, Échantillonnage, Probabilités Flashcards
Question sur les degrés de libertés : Est-ce qu’on peut les appliquer aux statistiques descriptives?
Non, lorsque c’est inférentiel on perd des degrés de libertés mais lorsque c’est avec la population on ne perd pas de degrés de libertés puisqu’on comprend qu’on a déjà toutes les informations sur la population.
Si les degrés de libertés ne s’applique pas, pourquoi la formule de variance fait-elle perdre un degré de liberté? C’est parce qu’on vise toujours à ESTIMER les paramètres de la populations avec ce genre de formule (donc c’est en lien avec les estimateurs, l’échantillon, etc etc)
La distribution normale gaussienne - Moyenne, mode et médiane sont ils égaux?
Oui, c’est une particularité de la distribution normale gaussienne. Les trois sont égaux dans cette distribution. Elle est aussi symétrique.
Distribution normale - Beaucoup de phénomènes peuvent-ils être expliqués par celle-ci?
Oui, on assume que beaucoup de phénomènes se distribuent selon la courbe normale (QI par exemple). On voit même des sous-phénomènes ou des sous-groupes qui répondent à ceci.
Distribution normale - Distribution d’échantillonnage
Les distributions d’échantillonnage suivent, le plus souvent, une distribution normale ce qui en fait un élément central des principes de la statistique inférentielle.
Peut-on généralement assumer une distribution normale?
OUÉ
Deux paramètres populationnels de la distribution normale?
μ et sigma
Dans lfond t’es tu capable d’utiliser la formule de la cote Z pour trouver une probabilité?
Oui si t’es pas nono sinon z = X -μ / sigma
Utilisation du tableau pour le score Z - WARNING
Toujours faire attention d’utiliser la plus petite portion OU la plus grande portion (selon le cas), quand même tannant comme erreur d’inattention qui te vole ton A+
C’est quoi une distribution d’échantillonnage? **QUESTION D’EXAMEN RETIENT ÇA PAR COEUR COMME SI TA VIE EN DÉPEND
La distribution des valeurs résultant du calcul d’une
statistique sur un grand nombre d’échantillons d’une grandeur (N)
donnée.
Réflexion derrière la distribution d’échantillonnage
On a un échantillon composé d’unité d’observation. À partir de cet échantillon, on prend des estimateurs pour estimer les paramètres de la population. On ne peut pas faire cela directement, il faudra donc une distribution d’échantillonnage. Il faut comparer les valeurs de l’échantillon à celle des valeurs de la distribution de l’échantillonnage qui pourra ensuite faire une inférence sur les paramètres de la population.
Autre manière de voir la distribution d’échantillonnage ;
C’est une distribution dérivée mathématiquement, créée à partir de construits mathématiques (comparé à construits empiriques par exemple) sur une statistique d’intérêt donné sur un grand nombre d’échantillon (un nombre d’échantillon quasi-infini) d’un nombre ‘n’ donné. Chaque échantillon doit donc avoir la même grandeur.
Combien d’unités d’observation faut-il pour que la distribution d’échantillonnage ait une forme normale
30 unités d’observation
Explication empirique de la distribution d’échantillonnage
*** En se fiant à l’image de la diapo 13
Gros cercle = population. On veut mesurer leur stress sur 10.
Pour des raisons X, on a pas accès à la population, juste des échantillons.
On prend l’échantillon x1, qui a une moyenne de 4/10.
On prend un autre échantillon x2, qui a une moyenne de 6/10
On répète ce processus là encore et encore jusqu’à ce que les possibilités de 4 personnes soient épuisées. La même personne va revenir plusieurs fois, mais avec d’autres personnes. Environ 4845 échantillons possibles.
On va donc créer une distribution avec nos échantillons
Si on a la moyenne de la distribution d’échantillonnage, on aura une moyenne pratiquement similaire que la population
***Ce qui est magique avec les stats, on pourra inférer comment les statistiques se distribuent dans la population
Relation entre la grandeur de l’échantillon et la variance de la distribution d’échantillonnage
Plus l’échantillon (N) est grand, plus la variance de la distribution
d’échantillonnage est petite ;
Plus l’ÉT est petit, plus on comprend que la moyenne est représentative de la population.
Donc, plus l’échantillon est grand, plus la variance de la distribution de l’échantillon sera petit. Plus l’échantillon est grand, plus les données vont se regrouper autour de la moyenne.
Théorème de la limite centrale - Définition
plus N est grand et plus la distribution d’échantillonnage s’approche d’une courbe normale et plus les tests inférentiels sont valides et puissants
Qu’est-ce que la puissance statistique?
La capacité de tester ce qu’on veut vraiment tester