Definition Des Principaux Concepts Flashcards
Protocole
Ensemble d’observations sur une ou plusieurs variables.
Échantillon
Ensemble d’individus statistiques sur lesquels sont recueillies les données constituant le protocole*.
L’échantillon est un sous ensemble de la population.
Population parente
Ou population.
C’est l’ensemble des individus statistiques d’où est extrait l’échantillon.
Elle est de taille finie.
Échantillonnage dans une population
C’est l’extraction d’un échantillon dans un ensemble de référence de taille finie.
Il peut être vu comme un tirage sans remise.
Échantillonnage dans une distribution
C’est l’extraction d’un échantillon dans un ensemble de référence de taille infinie.
Cette forme d’échantillonnage peut être assimilée à un tirage avec remise dans une population finie.
Principe général de l’inférence
Situer un échantillon dans l’espace des échantillons.
Pour cela, on situe un résumé du protocole dans une distribution d’échantillonnage*.
La conclusion de cette inférence dépend du modèle d’échantillonnage choisi.
Espace des échantillons
C’est l’ensemble de tous les échantillons possibles obtenus par combinatoire.
Distribution d’échantillonnage
C’est la distribution, pour une statistique donnée, de l’ensemble des échantillons possibles.
- Pour les variables numériques, la distribution d’échantillonnage est faite sur la MOYENNE.
- Pour les variables Nominale ou catégorisées, on utilise généralement la FRÉQUENCE pour construire la distribution d’échantillonnage.
Modèle d’échantillonnage
C’est l’ensemble des hypothèses que l’on fait sur le mode de constitution der l’échantillon à partir de la population.
Inférence statistique
Forme de raisonnement hypothético-déductif.
Dans cette forme de raisonnement, on cherche à tester une hypothèse à travers un raisonnement déductif dont la démarche suit un questionnement*.
Questionnement de la démarche du raisonnement déductif
1- se demander quel est l’ensemble des protocoles possibles. Cet ensemble de protocoles est obtenu par combinatoire d’où le nom de cette approche.
Dans cette approche , le protocole observé est un des protocoles possibles, mais n’est pas nécessairement tiré au hasard.
2-Ensuite on cherche à situer le protocole observé dans l’ensemble des protocoles possibles.
Pour cela, on calcule sur chacun des protocoles possibles une statistique résumant les protocoles (statistique d’échantillonnage). Dans le cas des variables catégorisées, c’est-à-dire nominale ou ordinale, cette statistique est la fréquence. Dans le cas des variables numériques, cette statistique est la moyenne. Ces statistiques résumant les protocoles sont utilisées pour calculer une distribution qui permettra de situer le protocole observé dans l’ensemble des protocoles possibles. Cette distribution est ce qu’on appelle distribution d’échantillonnage.
3- Enfin, on se demandera si le protocole observé est suffisamment rare dans la distribution d’échantillonnage pour le considérer comme atypique ou si on doit le considérer comme typique.
Modèle d’échantillonnage
Ensemble des hypothèses que l’on fait sur le mode de constitution de l’échantillon à partir de la population.
Le choix du modèle d’échantillonnage détermine la formulation de la conclusion.
Modèle d’échantillonnage combinatoire
Consiste à considérer le protocole observé comme un élément de l’ensemble des protocoles possibles (espace des échantillons).
Formulation de la conclusion dans le cadre du modèle combinatoire
Elle se formulera en termes de typicité* ou d’homogénéité .
Typicité
comparaison d’un groupe d’observations à une distribution de référence