Estimation et intervalle de confiance Flashcards
Définition interférence statistique
Consiste à estimer les caractéristiques inconnues d’une population à partir d’un échantillon issu de cette population. Les caractéristiques de l’échantillon, une fois connues, réflètent avec une certaine marge d’erreur possible celles de la population.
Définition de échantillonage
Sélectionner de manière aléatoire un certain nombre d’individus (échantillon) dans une population afin de pouvoir tirer des conclusions au sujet de cette même population.
Si l’échantillon est aélatoire, on peut utiliser la théorie des probabilités pour quantifier l’incertitude (précision) des conclusions qui seront tirées.
Cette incertitude provient du fait qu’on a de l’information sur uniquement une portion des sujets (un échantillon).
Lorsqu’on ne prend qu’un échantillon, que peut-on déduire à partir de seulement la moyenne de cet échantillon?
En examinant comment la moyenne de cet échantillon s’approche de la valeur de la moyenne dans la population et pour mesurer ceci, il lui faut la distribution théorique de la variable aléatoire ainsi que l’écart-type de cette distribution. À partir de ces deux valeurs, on pourra construire un intervalle de confiance ayant un certain niveau de confiance.
Comment est constitué un intervalle de confiance?
Estimateur ponctuel +/- marge d’erreur
(Estimateur ponctuel - marge d’erreur ; Estimateur ponctuel + marge d’erreur)
Estimateur ponctuel : Valeur estimée du paramètre obtenu à partir de l’échantillon
Marge d’erreur : Estimation de l’étendue que les paramètres peuvent avoir si on fait de nouveaux échantillonnages
Définition de intervalle de confiance
L’intervalle de confiance à (1-alpha) (ou au risque alpha) est un intervalle qui a une probabilité (1-alpha) de contenir la vraie valeur (inconnue) du paramètre.
L’intervalle de confiance est centré sur la valeur numérique estimée du paramètre inconnu x et contenant la vraie valeur vrai X avec une probabilité (1-alpha), où la valeur de alpha est fixée à priori.
Si l’intervalle de confiance est à 95%, il a 95% de chances de contenir la vraie valeur du paramètre (valeur de la population).
Quel est le théorème central limite?
- La distribution d’échantillonnage des moyennes est normalement distribuée si la population est normalement distribuée
- Même si la population n’est pas normalement distribuée, la distribution d’échantillonnage des moyennes est approché par une distribution normale si n est grand (n>30)
Quelle est la loi normale?
La loi normale représente beaucoup de phénomènes aléatoires. C’est une distribution symétrique en forme de cloche. L’aire totale sous la courbe est de 1 ou 100%.
Quelle est la formule d’un intervalle de confiance?
IC = Moyenne échantillon + ou - Z (pour le alpha choisi) x Écart type de la moyenne
Écart type = Écart-type pop / Racine de taille échantillon
Ou
Écart type = Écart-type échantillon / Racine de taille échantillon
Voir dans les notes, jsuis pas cap de mettre la formule ici
Quelle est la signification du sigma?
Erreur-type de la moyenne
Quelle est la formule du sigma?
σ/√n si la variance de la population est connue, sinon c’est s/√n
Quelle est la formule d’un intervalle de confiance à 95%?
x -1,96.σ/√n ≤ μ ≤ x +1,96.σ/√n
Quelle est la formule d’un intervalle de confiance à 99%?
x -2,58.σ/√n ≤ μ ≤ x +2,58.σ/√n
Quelle est l’interprétation probalistique d’un intervalle de confiance à 95%?
Si on sélectionne de façon indépendant plusieurs échantillons à partir d’une population ayant une distribution normale, 95% des intervalles de confiance de niveau 95% vont contenir la moyenne de la population μ
Quelle est l’interprétation pratique d’un intervalle de confiance à 95%?
Lorsqu’on sélectionne un échantillon à partir d’une population distribuée de façon normale, on est certains à 95% que l’intervalle de confiance à 95% contient la moyenne de la population μ
Plus n est grand, plus IC est __________
Plus n est grand, plus IC est petit