Cours 1.2 Flashcards
À l’aide de quel mesure peut-on démontrer l’utilité d’un modèle statistique ?
La moyenne : Nous permet de voir la représentativité de nos données
Dans les deux cas suivant, laquelle est une moyenne représentative des données :
L’étudiant 1 L’étudiant 2
Cours 1 : 80 % Cours 1 : 100 %
Cours 2 : 79 % Cours 2 : 0
Cours 3 : 81 % Cours 3 : 100%
Cours 4 : 80 % Cours 4 : 0
Étudiant 1 M = 80
Étudiant 2 M = 50
La moyenne de l’étudiant 1
Quelle mesure pour savoir l’adéquation d’un modèle, son “fit”
L’écart-type
L’écart-type
Comment nos données varies à l’intérieur de l’échantillon
Définition
Population
Ensemble d’unités à partir desquels nous voulons généraliser un ensemble de résultat
Définition
Échantillon
Un ensemble (plus petit) d’unités à partir duquel on veut inférer des caractéristqiues portant sur la population.
En statistique, pourquoi est-ce moins courant de passer un questionnaire à une population entière ?
Très couteux et trop long
On souhaite avoir un échantillon ____ de la population.
Échantillon représentatif de la population
Comment pouvons-nous s’assurer d’avoir un échantillon représentatif ?
À l’aide d’un échantillon aléatoire
Minimise les biais possible, plus de chance d’être représentatif
Vrai ou faux : un échantillon aléatoire est une assignation aléatoire
Faux.
Échantillon aléatoire : On sélectionne de manière aléatoire des participants d’une population.
Assignation aléatoire : On sélectionne les participants au sein d’un échantillon et on les assignent au groupe expérimental ou témoin de manière aléatoire.
Plus mon échantillon est ____ plus la possibilité de refléter la vraie valeur dans la population est haute.
Plus mon échantillon est élevé plus la possibilité de refléter la vraie valeur dans la population est haute.
La statistique ____ : Plus le n est élevé, plus je peux être confiant de ma prédiction, car je me rapproche de la ____ valeur de la population.
La statistique inférentielle : Plus le n est élevé, plus je peux être confiant de ma prédiction, car je me rapproche de la population valeur de la population.
Statistiques inférentielles
900 républicains et 100 démocrats, est-ce que mon échantillon me permet de faire une prédiction avec confiance que Trump remportera l’Alabama.
Oui, parce que l’échantillon est grand, il y peu de variation dans les votes.
Wisconsin 51 pour Trump et 49 pour Harris, est-ce que mon échantillon me permet de faire une prédiction avec confiance que Trump remportera ?
Non, mon échantillon est trop petit et il y a beaucoup de variation dans l’échantillon.
Statistiques inférentielles
Faire des prédictions sur la population à partir d’un échantillon.
Vrai ou faux : on ne connaît jamais la vraie valeur de la population
Vrai
Que signifie l’équation : Outcome = (model) + error
Il s’agit de la prédiction du résultat d’une variable en se fiant à un model statistiques dans lequel se trouve une certaine mesure d’erreur (prédiction imparfaire)
Le modèle en statistique permet de ____ les ____.
Le modèle en statistique permet de décrire les données.
On l’utilise pour représenter ce qui se produit dans la réalité.
Qu’est-ce qu’on veut dire par “la moyenne est hypothétique”, donne un exemple.
La valeur ne doit pas nécesssairement exister dans les données.
Exemple : avoir 2.6 amis
La moyenne
La moyenne est la somme de tous les scores divisés par le nombre d’unité