Principes Généraux Flashcards

0
Q

Les analyses statistiques, quelles qu’elles soient, portent sur un protocole recueilli sur un échantillon issu d’une population parente.
Qu’est qu’un protocole?
Qu’est-ce qu’un échantillon?
Qu’est-ce qu’une population parente?

A
  • Protocole. Ensemble d’observations sur une ou plusieurs variables.
  • Échantillon. Ensemble d’individus statistiques sur lesquels sont recueillies les données constituant le protocole. L’échantillon est un sous-ensemble de la population.
  • Population parente. Également appelée population, c’est l’ensemble des individus statistiques d’où est extrait l’échantillon. La population parente est de taille finie.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

On distinguera l’échantillonnage dans une population et l’échantillonnage dans une distribution.
Qu’est-ce que l’échantillonnage dans une population?
Qu’est-ce que l’échantillonnage dans une distribution?

A
  • Échantillonnage dans une population. C’est l’extraction d’un échantillon dans ensemble de référence de taille finie. L’échantillonnage dans une population peut être vu comme un tirage sans remise.
  • Échantillonnage dans une distribution. C’est l’extraction d’un échantillon dans un ensemble de référence de taille infinie. Cette forme d’échantillonnage peut être assimilée à un tirage avec remise dans une population finie.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Le principe général de l’inférence consiste à situer un échantillon dans l’espace des échantillons. Pour cela, on situe un résumé du protocole dans une distribution d’échantillonnage. La conclusion de cette inférence dépend du modèle d’échantillonnage choisi.
Qu’est-ce que l’espace des échantillons?
Qu’est-ce qu’une distribution d’échantillonnage?
Qu’est-ce qu’un modèle d’échantillonnage?

A
  • Espace des échantillons. C’est l’ensemble de tous les échantillons possibles obtenus par combinatoire.
  • Distribution d’échantillonnage. C’est la distribution, pour une statistique donnée, de l’ensemble des échantillons possibles. Pour les variables numériques, la distribution d’échantillonnage est faite sur la moyenne. Pour les variables nominales ou catégorisée, on utilise généralement la fréquence pour construire la distribution d’échantillonnage.
  • Modèle d’échantillonnage. C’est l’ensemble des hypothèses que l’on fait sur le mode de constitution de l’échantillon à partir de la population.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelle est la démarche de l’inférence statistique?

A

on cherche à tester une hypothèse à travers un raisonnement déductif dont la démarche suit le questionnement suivant :
1/ quel est l’ensemble des protocoles possibles? Cet ensemble de protocoles est obtenu par combinatoire, d’où le nom de cette approche, Dans cette approche, le protocole observé est un des protocoles possibles, mais n’est pas nécessairement tiré au hasard.
2/situer le protocole observé dans l’ensemble des protocoles possibles. Pour cela, on calcule sur chacun des protocoles possibles une statistique résumant les protocoles (statistique d’échantillonnage). Dans le cas des variables catégorisées, c’est-à-dire nominale ou ordinale, cette statistique est la fréquence. Dans le cas des variables numériques, cette statistique est la moyenne. Ces statistiques résumant les protocoles sont utilisées pour calculer une distribution qui permettra de situer le protocole observé dans l’ensemble des protocoles possibles. Cette distribution est ce qu’on appelle distribution d’échantillonnage.
3/on se demandera si le protocole observé est suffisamment rare dans la distribution d’échantillonnage pour le considérer comme atypique ou si on doit le considérer comme typique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce qu’un modèle d’échantillonnage? Quels en sont les différents types?

A
  • Le modèle d’échantillonnage est l’ensemble des hypothèses que l’on fait sur le mode de constitution de l’échantillon à partir de la population. Concrètement, le choix du modèle d’échantillonnage n’engage en rien le choix de la distribution d’échantillonnage et de la procédure à mettre en oeuvre. En revanche, le choix du modèle d’échantillonnage détermine la formulation de la conclusion.
  • Dans tous les cas, on peut se placer dans le cadre du modèle combinatoire qui consiste à considérer le protocole observé comme un élément de l’ensemble des protocoles possibles (espace des échantillons). La conclusion se formulera en termes de typicité (comparaison d’un groupe d’observations à une distribution de référence) ou d’homogénéité (comparaison de deux groupes d’observations).
  • On peut parfois se situer dans le cadre du modèle fréquentiste qui consiste à considérer que la distribution d’échantillonnage est une distribution des probabilités d’obtenir un échantillon de telle ou telle moyenne. Ce modèle constitue un prolongement du modèle combinatoire. Pour cela, on fait l’hypothèse supplémentaire que l’échantillon a été tiré au hasard dans l’ensemble des protocoles possibles. Cette hypothèse n’est justifiée que si la procédure expérimentale fait intervenir le hasard (sondage ou aléatorisation de la répartition des sujets) ou si l’expérience vise véritablement à tester une hypothèse, autrement dit que la comparaison est faite toutes choses égales par ailleurs.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Comment choisir la distribution d’échantillonnage?

A
  • Ce choix dépend de l’échelle de mesure de la variable dépendante. On distinguera les variables numériques, pour lesquelles on peut utiliser des tests dits paramétriques des autres variables pour lesquelles on utilise des tests non paramétriques. -Dans les deux cas, on peut utiliser une distribution exacte ou une distribution approchée.
  • Les distributions d’échantillonnage exactes sont obtenues par combinatoire ou en ayant recours lorsqu’elles existent, à des distributions particulières.
  • On peut également utiliser une distribution approchée. Pour les variables nominales, il s’agit de la distribution de X2 (lire khi- deux ou khi carré). Pour les variables numériques, si la variance parente est connue, on emploiera la distribution de Z sinon on emploiera la distribution du T de Student.
  • Chaque fois que cela est possible, on préférera la distribution exacte à la distribution approchée.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Sur quoi repose la formulation de la conclusion?

A

La formulation de la conclusion repose toujours sur une comparaison entre la proportion observée (calculée ou lue dans une table) et un seuil de significativité fixé par convention à .025 (seuil unilatéral) ou à .05 (seuil bilatéral). Lorsque la proportion observée est inférieure au seuil, le test est déclaré significatif.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Comment se choisit le seuil?

A

Le choix entre un seuil unilatéral ou bilatéral dépend du type de comparaison que l’on fait et de la question qu’on se pose:

  • unilatéral supérieur (.025): le groupe 1 est-il supérieur au groupe 2?
  • unilatéral inférieur (.025): le groupe 1 est-il inférieur au groupe 2?
  • bilatéral (.05): le groupe 1 est-il différent du groupe2?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

De quoi dépend l’interprétation du test?

A

-D’un point de vue statistique, l’interprétation du test dépend du type de comparaison que l’on fait et du modèle d’échantillonnage choisi. Le test est significatif si pobs ≤ seuil repère. ( ça veut dire que le groupe est atypique ou hétérogène)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

En quels termes sera formulée la conclusion dans le cas du modèle combinatoire?

A

Dans le cas du modèle combinatoire, la conclusion sera formulée en termes de typicité ou d’atypicité de l’échantillon dans le cas de l’inférence sur une protocole univarié non structuré et en termes d’homogénéité ou d’hétérogéneité des groupes dans le cas de l’inférence sur des protocoles univariés structurés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment sera formulée la conclusion dans de l’inférence fréquentiste?

A

Dans le cas de l’inférence fréquentiste, la conclusion sera formulée en termes de conservation ou de rejet de l’hypothèse nulle, ce qui conduira à admettre l’existence d’une différence dans le cas d’un test significatif, un test non significatif ne permettant pas de conclure.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Par quelle formule est donné le nombre des combinaisons possibles?

A

Le nombre de combinaisons possibles est donné par la formule du nombre de combinaisons :
N! / n! (N-n)!
FACULTATIF
Par exemple, si on cherche à savoir combien de couples sont possibles dans une population de 5 éléments, on peut se représenter intuitivement que chacun des individus peut être associés à chacun des quatre autres. On a donc 20 paires. L’ordre des éléments dans les couples n’ayant pas d’importance, on a 10 couples possibles. Mettons en application la formule de calcul du nombre de combinaisons de deux éléments dans un ensemble de 5 éléments.
5! / 2! ( 5-2 )! = 10

Ici N =5 et n=2. N suivi d’un point d’exclamation se lit factoriel de 5 et se développe en multipliant le nombre par tous les entiers inférieurs. La factorielle de 5 est donc 54321. De la même manière, la factorielle de 2 est égale à 21 et la factorielle de 5-2, c’est-à-dire la factorielle de 3 se développe en 32*1. Il ne reste plus qu’à simplifier la fraction en supprimant les facteurs communs. Dans cet exemple, le nombre de combinaisons possibles est donc de 10.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly