Statistiques inférentielles Flashcards
Quelles est la différence entre les statistiques descriptives et inférentielles/inductives?
La 1ère a pour objectif de décrire, c’est-à-dire de résumer ou représenter, par des statistiques, les données d’un échantillon quand elles sont nombreuses.
La 2e a pour objectif d’estimer les caractéristiques d’une population à partir de données d’un échantillon représentatif de cette population.
Comment s’appelle les caractéristiques numérique d’une population?
Paramètres
Comment s’appelle les caractéristiques numérique d’un échantillon ?
Statistiques
L’inférence statistique permet d’utiliser les statistiques échantillonales pour…
1) Estimer des paramètres populationnels
2) Tester des hypothèses au sein d’une population
L’inférence d’un paramètre à partir d’une statistique est basée sur quelle théorie? Expliquez celle-ci.
La théorie des probabilités.
Elle implique que l’échantillon a été tiré aléatoirement de la population ou qu’il soit au moins représentif de celle-ci. Si l’échantillon a été tiré aléatoirement, alors l’erreur peut être bien évalué, et l’inférence du paramètre est libre d’erreur au de-là de l’erreur aléatoire.
Quelle est le modèle de base de l’inférence statistique?
Statistique = Paramètre + erreur
Qu’est-ce que le théorème central limite?
Toute somme de variables aléatoires indépendantes et
identiquement distribuées tend vers une variable aléatoire gaussienne (courbe normale).
Si on pouvait tirer un nombre infini d’échantillons aléatoires d’une population, la distribution des moyennes échantillonnales serait normale et la moyenne de cette distribution serait la moyenne populationnelle.
Si la taille échantillonnale est grande (n > 30), la distribution
des moyennes échantillonnales sera à peu près normale.
Qu’est-ce que l’erreur-type?
Écart « moyen » entre la moyenne échantionnalle et la moyenne populationnelle
Comment s’apelle l’écart-type de la distribution des moyennes échantionnales ?
Erreur-type
Plus la taille de l’échantillon (n) est grande, plus l’erreur-type est petite, l’estimation sera précise et moins elle aura tendance à inclure
le zéro.
VRAI OU FAUX?
Vrai.
Que signifie une intervalle de confiance de 95% ?
Si on pouvait calculer des IC(95%) pour une infinité
d’échantillons aléatoires provenant de la même population, la moyenne de la population serait incluse dans 95% d’entre eux.
Une intervalle qui a 95% de chances d’inclure la
moyenne populationnelle.
Une estimation de la moyenne populationnelle avec un niveau de confiance de 95%.
Qu’est-ce qu’un test de signification statistique?
Par tradition, les chercheur.es visent à rejeter H0 pour appuyer l’idée qu’il existe un effet non nul ou une différence non nulle.
Dans un test de signification statistique, on se demande…
À quel point est-ce que la différence ou l’effet observé dans l’échantillon est suffisamment élevé ou surprenant pour rejeter H0?
Par rapport à quoi on décide si la valeur p est statistiquement significative?
Le seuil de signification statistique (alpha) à 5% (0.05) généralement.
Quelle est la formule du seuil de signification?
alpha = 1 - IC
Quelle est la formule de la signification statistique?
Signification statistique = Taille d’effet X taille de l’échantillon