Chapitre 13: la théorie des intervalles de confiance Flashcards
SD
informe sur la dispersion des observations. 2/3 des observations entre Mx - SD et Mx + Sd
ESM (inférence)
informe sur la précision avec laquelle la moyenne de la population est connue
CI (inférence)
informe sur la zone dans laquelle on s’attend à trouver le paramètre de la population : limites = Mx ± t*. ESM
Range (descriptif)
informe sur la dispersion des observations (ne prend en compte que le min et le max).
Quartiles (descriptif)
informe sur la dispersion des observations
Comment utilise-t-on les données en théorie des probabilités ?
on part d’une population connue et on calcule ensuite les probabilités d’obtenir différents échantillons possibles.
Comment utilise-t-on les données en analyse statistique ?
on démarre avec des données et on teste ensuite la vraisemblance que les données aient été échantillonnées dans diverses populations
Si le rapport t a une valeur comprise entre -5 et 5 pour 95% des échantillons, que se passe-t-il ?
alors la valeur de t* sera définie comme étant égale à 5.
De quoi dépend la valeur de t*?
dépend de la taille de l’échantillon et du degré de confiance souhaité.
Sa valeur ne dépend pas des données réellement analysées
Rééchantillonnage
approche alternative en statistiques qui ne suppose pas que la distribution soit gaussienne ou autre.
La méthode appelée bootstrapping ou computer-intensive méthode, s’applique sur quoi ?
Elle s’applique aux IC de la médiane, à l’écart interquartile ou à presque tous les autres paramètres. Elle est largement utilisée dans l’analyse des données génomiques
Avec des données continues, l’approche par rééchantillonnage est plus souple que l’approche par la distribution t, pourquoi ?
parce qu’elle ne se base pas sur l’hypothèses d’une distribution gaussienne (ou autre).