Definition Des Principaux Concepts Flashcards
Protocole
Ensemble d’observations sur une ou plusieurs variables.
Échantillon
Ensemble d’individus statistiques sur lesquels sont recueillies les données constituant le protocole*.
L’échantillon est un sous ensemble de la population.
Population parente
Ou population.
C’est l’ensemble des individus statistiques d’où est extrait l’échantillon.
Elle est de taille finie.
Échantillonnage dans une population
C’est l’extraction d’un échantillon dans un ensemble de référence de taille finie.
Il peut être vu comme un tirage sans remise.
Échantillonnage dans une distribution
C’est l’extraction d’un échantillon dans un ensemble de référence de taille infinie.
Cette forme d’échantillonnage peut être assimilée à un tirage avec remise dans une population finie.
Principe général de l’inférence
Situer un échantillon dans l’espace des échantillons.
Pour cela, on situe un résumé du protocole dans une distribution d’échantillonnage*.
La conclusion de cette inférence dépend du modèle d’échantillonnage choisi.
Espace des échantillons
C’est l’ensemble de tous les échantillons possibles obtenus par combinatoire.
Distribution d’échantillonnage
C’est la distribution, pour une statistique donnée, de l’ensemble des échantillons possibles.
- Pour les variables numériques, la distribution d’échantillonnage est faite sur la MOYENNE.
- Pour les variables Nominale ou catégorisées, on utilise généralement la FRÉQUENCE pour construire la distribution d’échantillonnage.
Modèle d’échantillonnage
C’est l’ensemble des hypothèses que l’on fait sur le mode de constitution der l’échantillon à partir de la population.
Inférence statistique
Forme de raisonnement hypothético-déductif.
Dans cette forme de raisonnement, on cherche à tester une hypothèse à travers un raisonnement déductif dont la démarche suit un questionnement*.
Questionnement de la démarche du raisonnement déductif
1- se demander quel est l’ensemble des protocoles possibles. Cet ensemble de protocoles est obtenu par combinatoire d’où le nom de cette approche.
Dans cette approche , le protocole observé est un des protocoles possibles, mais n’est pas nécessairement tiré au hasard.
2-Ensuite on cherche à situer le protocole observé dans l’ensemble des protocoles possibles.
Pour cela, on calcule sur chacun des protocoles possibles une statistique résumant les protocoles (statistique d’échantillonnage). Dans le cas des variables catégorisées, c’est-à-dire nominale ou ordinale, cette statistique est la fréquence. Dans le cas des variables numériques, cette statistique est la moyenne. Ces statistiques résumant les protocoles sont utilisées pour calculer une distribution qui permettra de situer le protocole observé dans l’ensemble des protocoles possibles. Cette distribution est ce qu’on appelle distribution d’échantillonnage.
3- Enfin, on se demandera si le protocole observé est suffisamment rare dans la distribution d’échantillonnage pour le considérer comme atypique ou si on doit le considérer comme typique.
Modèle d’échantillonnage
Ensemble des hypothèses que l’on fait sur le mode de constitution de l’échantillon à partir de la population.
Le choix du modèle d’échantillonnage détermine la formulation de la conclusion.
Modèle d’échantillonnage combinatoire
Consiste à considérer le protocole observé comme un élément de l’ensemble des protocoles possibles (espace des échantillons).
Formulation de la conclusion dans le cadre du modèle combinatoire
Elle se formulera en termes de typicité* ou d’homogénéité .
Typicité
comparaison d’un groupe d’observations à une distribution de référence
Homogénéité
comparaison de deux groupes d’observations.
Modèle d’échantillonnage fréquentiste
Consiste à considérer que la distribution d’échantillonnage est une distribution des probabilités d’obtenir un échantillon de telle ou telle moyenne.
Ce modèle constitue un prolongement du modèle combinatoire.
Choix de la distribution d’échantillonnage
Il dépend de l’échelle de mesure de la variable dépendante.
On distingue l’échelle numérique pour lesquelles on utilise des tests dits paramétriques, des autres variables pour lesquelles on utilise des tests non parametriques.
Dans les 2 cas on peut utiliser une distribution exacte* ou une distribution approchée*.
Comment obtient on une distribution d’échantillonnage exacte?
Par combinatoire ou en ayant recours lorsqu’elles existent, à des distributions particulières.
De quoi dépend la mise en oeuvre du test statistique?
Elle dépend du type de protocole et de la distribution d’échantillonnage choisi.
NE dépend pas du modèle d’échantillonnage?
4 cas de tests statistiques
- L’inférence sur un protocole univarié non structuré
- l’inférence sur un protocole univarié structuré par emboîtement (groupes indépendants.
- l’inférence sur un protocole univarié structuré par croisement (groupes appariés)
- l’inférence sur un protocole bivarié.
Étapes du schéma de l’inférence
- Choisir le modèle d’échantillonnage (combinatoire ou fréquentiste)
- déterminer la distribution d’échantillonnage
- situer le protocole observé dans la distribution d’échantillonnage en calculant (ou en lisant sur la table) la proportion d’échantillons plus extrêmes ou égaux au protocole observé.
- comparer cette proportion au seuil-repère .025 (unilatéral) ou .05 (bilatéral)-.
Sur quoi repose la formulation de la conclusion?
Elle repose toujours sur
Une comparaison entre la proportion observée (calculée ou lue sur la table) et un seuil significatif fixé par convention à .025 (seuil unilatéral) ou .05(seuil bilatéral).
Lorsque la proportion observée est inférieure au seuil, le test est déclaré significatif.
De quoi. Dépendra le choix entre un seuil unilatéral ou bilateral?
Il dépend du type de comparaison que l’on fait et de la question qu’on se pose.
Types de comparaisons à distinguer:
- La comparaison d’un groupe d’observations à une population ou une distribution de référence (échantillon vs population)
- la comparaison de 2 groupes d’observations.
Questions qu’on se pose dans le cas d’un seuil unilatéral ou bilatéral:
- seuil unilatéral: « est-il supérieur? Est il inférieur? Échantillon du coté des valeurs élevées? Faibles?…»
- seuil bilatéral: le groupa 1 est il DIFFÈRENT du groupe 2? L’echantillon est il DIFFÉRENT de la population…»
Seuil bilatéral
Rest égal à la somme des seuils unilatéraux supérieurs et inférieurs.
Dans le cas particulier des distributions d’échantillonnage symétriques, le seuil bilatéral est égal au double d’un des seuils unilatéraux?
D’un point de vue statistique, de quoi dépend l’interprétation du test?
Il dépend du type de comparaison que l’on fait et du modèle d’échantillonnage choisi.
Le test est significatif si P de O de obs est inférieur ou egal au seuil repère.