Statistiques probabilistes Flashcards
Quels aspect comportent une estimation ?
- une estimation ponctuelle avec une valeur estimée
- complétée par un intervalle de confiance
Définition épreuve
observation d’un caractère (V) pour chaque individu pris.
La variable aléatoire V est celle qui assoie une valeur (v)i à chaque individu (i).
La variable aléatoire va donner la loi de distribution du caractère V
Définition expérience
répétition N fois de l’épreuve.
La variable aléatoire (I) associe un indicateur à chaque échantillon.
On obtient alors la loi de distribution/d’échantillonage de l’indicateur (I)
Distribution d’échantillonnage pour une modalité du caractère V
avec la fréquence : VA F
Distribution d’échantillonnage pour une variable quantitative
avec la moyenne VA M ou la variance VA Se²
De quoi dépend la distribution d’échantillonnage ?
de l’indicateur : chaque indicateur a le sien
Distribution d’échantillonnage avec une fréquence
> fe trouvé dans un échantillon pour une modalité d’une variable
elle réalise la VA F qui suit une loi binomiale
Φ est la fréquence de la modalité dans la population
Que représente Var(F)
la dispersion des valeurs observées dans CHAQUE ÉCHANTILLON par rapport à la valeur moyenne
Que représente σ^2
la dispersion des valeurs de CHAQUE INDIVIDU DANS UN ÉCHANTILLON/une population par rapport à la valeur moyenne de CET échantillon/population
Comment évolue var(F) lorsque N augmente
elle diminue : on observe moins de dispersion de fréquence par rapport à la fréquence moyenne
Vers quoi se rapproche la fréquence lorsque N augmente ?
elle se rapproche de Φ
A quelles conditions la loi de F devient Gaussienne ?
lorsque NΦ et N(1-Φ) augmentent et à partir de NΦ>5 et N(1-Φ)>5
Distribution d’échantillonnage avec une moyenne
> la moyenne me d’une variable (X), est calculée pour un échantillon de N individus et réalise une VA
si X suit une loi gaussienne, M suit cette loi
Dans quelle condition la loi centrée réduit de M suit-elle une loi gaussienne ?
lorsque N>30
Distribution d’échantillonnage avec une variance
> la variance Se² d’une variable X est calculée pour un échantillon d’individu (N) et réalise une VA
Quel est le rapport entre la variance de l’échantillon et la variance dans la population ?
la variance de l’échantillon sera plus faible que la variance dans la population
> il faudra donc la corriger en l’augmentant
Vers quoi tend la variance Se²
vers 0 lorsque N tend vers l’infini
> donc Se² tend vers σ² (espérance)
Quelle loi suit la VA Nse²/σ² lorsque X suit une loi gaussienne
une loi de X² (Khi²) à v= N-1 ddl
Distribution d’échantillonnage avec un rapport de variances
> pour deux échantillons (N1 et N2 individus), pris dans des populations de variance σ1² et σ2² (pour un caractère X donné), la variable aléatoire est un rapport de variance
suit une loi de Snedecor à N1-1 et N2-1 ddl
Que donne une loi d’échantillonnage ?
une connaissance sur la variance lorsqu’on change d’échantillon : elle rassemble les valeurs obtenues dans chaque échantillon
Qu’est-ce qu’un estimateur ?
c’est une variable aléatoire (Estim) sur les échantillons qui vérifie les conditions :
E(estim) = k
et
Var(estim) tend vers 0
lorsque N tend vers infini
Quelle est la meilleure estimation d’un indicateur pour un échantillon N ?
rendre la valeur de l’estimateur
ex. F est l’estimateur de Φ, M est l’estimateur de μ
Quelle est la meilleure estimation pour μ ?
me
Quelle est la meilleure estimation pour Φ ?
fe
Quelle est la meilleure estimation pour σ² ?
(Se².N) / (N-1)
Qu’utilise-t-on pour préciser l’estimation ?
un intervalle de confiance
Que sont les intervalles de pari ?
des outils pur les tests d’hypothèses
A quoi correspond H₀ ?
> correspond à ce que rien ne se réalise (=les données récoltés correspondent aux anciennes données)
hypothèse nulle que l’on suppose vraie : une seule
A quoi correspond H₁ ?
hypothèse alternative : une ou plusieurs
Dans le cas d’un médicament, qu’est-ce que H₀ est souvent ?
“le nouveau médicament n’est pas aussi efficace que l’ancien”
En supposant que H₀ est vraie dans l’échantillon étudié, que fait-on ?
> on tire les conséquences avec leurs probabilités
on examine la compatibilité des données et des conséquences
on calcul un intervalle de pari pour estimer l’indicateur ke dans l’échantillon
En supposant que H₀ est vraie dans l’échantillon étudié, quelles possibilités a-t-on ?
> les données sont improbables sous H₀
les données sont probables sous H₀
En cas de données probables sous H₀
> données proches des valeurs attendues
on accepte l’hypothèse H₀
En cas de données improbables sous H₀
> données trop éloignées des valeurs attendues
on choisit de dire que H₀ n’est pas réalisée, mais qu’une alternative H₁ est réalisée
A quoi correspond α dans un test d’hypothèse ?
> au risque de se tromper en rejetant H₀
risque auquel on consent en faisant le test
A quoi correspond β dans un test d’hypothèse ?
> risque de se tromper en acceptant H₀
ne peut être calculer qu’en connaissant H₁
autant de risque β que d’hypothèses H₁
Comment calcule-t-on la puissance d’un test d’hypothèse ?
1 - β
Que fait-on lors d’un test d’hypothèse ?
on fait un test statistique
> les situations H₀ sont multiples mais on les rassemble en classe
Pour quoi les test d’hypothèses sont-ils utiles ?
> les tests cliniques
les études expérimentales
Principe du test de conformité
On fixe α avant le test
> si ke est dans l’intervalle de pari au risque α, on accepte H₀
> sinon on rejette H₀, ke n’est pas conforme à k
Variante du test de conformité
on utilise une seule borne de l’intervalle de pari :
> test unilatéral droit
> test unilatéral gauche
Test unilatéral droit (conformité)
> on conserve la borne supérieure (≤)
objectif : diminuer l’indicateur
si on est à gauche de la borne : non significatif
si on est à droite de la borne : significatif
Test unilatéral gauche (conformité)
> on conserve la borne inférieure (≥)
objectif : augmenter l’indicateur
si on est à gauche de la borne : significatif
si on est à droite de la borne : non significatif
Raccourci utilisé dans un test de conformité
> calcul de X² (= ε ou t)
comparaison à des valeurs de seuil ε(α)
si ε(α) > ε : on accepte H₀
si ε > ε(α) : on rejette H₀ = test significatif
Comment calculer la différence réduite (X² ou ε ou t)
X² = [ (valeur de l’échantillon) - (valeur de conformité) ] / (écart type de la VA de l’indicateur)
Degré de signification (p) : test conformité
> ε(p) = ε(α-p) pour un test non significatif
plus petite valeur de α pour laquelle le test est significatif
dernière valeur avant d’arriver un test non significatif
plus p est petit, plus la certitude de l’hypothèse est élevée
Comment évolue α en fonction de ε(α) ?
> α augmente, ε(α) diminue
ε(α) augmente, α diminue
Conformité d’une fréquence fe à Φ
> on fixe α
on lit ε(α)
on calcule la différence réduit ε
ε = ( f - Φ) / √[Φ(1-Φ) / N]
interprétation : conformité d’une fréquence fe à Φ
Si NΦ et N(1-Φ) > 5 (=loi de Gauss)
> si ε > ε(α) : test significatif, fe non conforme à Φ, avec ε(p) = ε
=> on rejette H₀ (sinon on l’accepte)
conformité : table pour un test bilatéral
> fabriquée pour un test bilatéral (α/2) de chaque côté
conformité : table pour un test unilatéral
> α d’un côté
ε(αx2) = ε(2α)
test unilatéral gauche au risque α : si ε > ε(2α) et fe < Φ : on rejette H₀
test unilatéral droit au risque α :
si ε > ε(2α) et fe > Φ : on rejette H₀
Principe conformité d’une moyenne me à μ
> sur un échantillon N, de moyenne me, d’estimation m, de variance Se², on fixe α et on calcule la différence réduit δ
δ = (m - μ) / (S / √N)
= (m - μ) / (Se / √N-1)
conformité d’une moyenne me à μ pour N>30
> δ(α) = ε(α) (petit échantillon avec un caractère gaussien)
ou
δ(α) = t(α) à N-1 ddl (table de student)
Interprétation : conformité d’une moyenne me à μ pour N>30
> si δ > δ(α) : test significatif, non conforme, avec δ(p) = δ
=> on rejette H₀
si δ(α) > δ : on accepte H₀
Interprétation : conformité d’une moyenne me à μ pour N<30
> caractère non gaussien
utilisation d’autres méthodes de calcul
Interprétation : conformité d’une moyenne me à μ : test unilatéral
> risque α
on regarde si δ > δ(2α) avec soit
m > μ (uni droit) ou m < μ (unit gauche)
principe conformité d’une variance Se² et σ²
> pour un échantillon n, de variance Se² et d’estimation s², on fixe α et on calcule X²
X² = (nSe²) / σ²
on lit avec N-1 ddl :
X₁² = X² (1- α/2) et X₂² = X² (α/2)
Interprétation conformité d’une variance
> Si X² est hors de l’intervalle [X₁² ;X₂²]
le test est significatif, non conforme, on rejette H₀
sinon on l’accepte
Interprétation conformité d’une variance pour un test unilatéral droit
on lit : X₂² = X²(α)
> si X² > X₂² : on rejette H₀
Interprétation conformité d’une variance pour un test unilatéral gauche
on lit X₁² : X²(1-α)
> si X² < X₁² : on rejette H₀