Chapitre 3: De l'échantillon à la population Flashcards
Définition de paramètres
Caractéristiques de la population; caractéristique d’un modèle statistique.
On pose un modèle pour quelles raisons?
Pour trouver la u (moyenne) et sigma (l’écart-type).
Quand est-ce qu’il n’y a pas de biais?
Si l’espérance E correspond à ce que l’on veut, en l’occurence la moyenne.
Comment savoir si le modèle posé est juste, si on tourne bien autour de u (mu)?
- Simulations : dans un cas où on connait la population, on sait ce que vaut μ puis on compare.
- Bien tirer au hasard dans la population ; prendre un échantillon aléatoire et indépendant.
Que se passe-t-il si l’échantillon n’est pas pris de manière aléatoire et indépendante?
Si l’échantillon n’est pas pris de manière aléatoire et indépendante, E = μ+ δ donc estimation
biaisée.
Il s’agit d’une variation aléatoire + une variation systématique. Si l’on est très proche de μ, ce n’est pas un biais, mais de la variabilité.
Comment s’assurer qu’il n’y ait pas de biais dans le cas d’un sondage pré-électoral?
- S’assurer que nos hypothèses soient respectées.
- Comme on a les résultats à la fin du sondage, on peut comparer la valeur visée et la valeur vraie.
Sinon, si le résultat est biaisé, on obtiendra π+ δ, un biais.
Que signifie inférer ?
Inférer en statistique signifie tirer des conclusions, faire des prédictions ou formuler des hypothèses sur une population plus large en se basant sur un échantillon limité de données observées.
Quels sont les deux sens différents que la probabilité peut avoir en statistique?
Une fréquence relative à long terme ou un degré de croyance.
Quand parle-t-on de biais?
On parle de biais lorsque le design expérimental est incorrect, conduit en moyenne à une surestimation ou une sous-estimation.
Définition de population cible (d’intérêt)
Ensemble hypothétique d’individus à propos duquel on souhaite tirer une conclusion générale.
Définition de population échantillonnée
ensemble d’individus susceptibles de faire partie de l’échantillon.
Définition d’échantillon
Une partie d’un ensemble ou d’une population, qui peut être sélectionnée aléatoirement ou non, et qui est utilisée pour dire quelque chose à propos des caractéristiques de l’ensemble ou de la population d’origine.
Que se passe-t-il si l’échantillon est aléatoire?
Si l’échantillonnage est aléatoire, alors l’échantillon aura, en moyenne, les caractéristiques de
la population dont il provient.
Les échantillons provenant d’une même population sont tous différents.
Quand parle-t-on d’un échantillon représentatif ?
On ne parle d’échantillon représentatif que si on connaît certaines caractéristiques de la population d’intérêt et que l’on cherche à en déterminer d’autres.
Définition d’échantillonnage aléatoire
Prélèvement d’un échantillon au sein d’une population dont le résultat ne peut être prédit, dont les mécanismes sont incompris, qui est indépendant d’autres évènements.
Définition de description (en statistique)
Synthèse, numérique, d’une série d’observations faites au niveau d’un échantillon
Définition de UNE statistique
C’est une valeur résumée, calculée à partir des observations d’un échantillon.
Définition de LA statistique
C’est la science de la collecte, de l’analyse et de l’interprétation des statistiques.
Définition de la biostatistique
C’est l’application de la statistique à l’analyse de données biologiques et médicales.
Définition (officiel) d’un paramètre
Mesure qui décrit certaines caractéristiques d’une population.
Définition de l’inférence statistique
C’est l’utilisation d’observations issues d’un échantillon pour tirer des conclusions à propos des paramètres d’une population.
Définition de biais
écart entre le paramètre estimé au sein de la population échantillonnée (π’) et le paramètre visé dans la population cible (π).
Exemple de contexte où on extrapole souvent les conclusions de l’échantillon à la population?
- Contrôle de qualité
- Sondages politiques
- Études cliniques
- Expérimentations en laboratoires
Comment est la population par rapport à l’échantillon dans les contrôles de qualité ?
Dans les contrôles de qualité ou les sondages politiques et de marketing, la population est beaucoup plus grande que l’échantillon, mais est surtout finie et connue.
Comment est la population par rapport à l’échantillon en recherche biomédicale?
En recherche biomédicale, on suppose que la population est infinie ou du moins très large comparativement à l’échantillon.
Pour quelles raisons une valeur calculée à partir d’un échantillon pourrait ne pas être valable pour la population entière ?
- Erreur d’échantillonnage : moyenne/pente de régression/proportion calculée plus élevée ou plus basse que la population entière.
- Biais de sélection : collecte des informations non aléatoire.
- D’autres formes de biais : méthodologie expérimentale imparfaite…
Définition de modèle
Description mathématique d’une vision simplifiée du monde.
Un modèle consiste en une
description générale assortie de paramètres (moyenne, écart-type) qui prennent des valeurs
particulières.
Cite 2 objectifs en statistique
Un des objectifs de la statistique est de déterminer, par l’analyse de données, les valeurs des paramètres du modèle qui s’ajustera le mieux aux données.
Un autre but est de comparer des modèles afin d’identifier celui qui explique le mieux les données.
Que se passe-t-il si l’échantillon coïncide avec la population ?
- Il n’y a aucun intérêt à tirer une conclusion générale.
- Souvent, on a envie d’aller au-delà des données traitées.
- Se préoccuper surtout du modèle de probabilité sous-jacent qui génère des données.