COURS 4 Flashcards
Définition de l’inférence?
L’inférence consiste à tirer une conclusion au sujet des caractéristiques de la population (qui sont inconnues) à partir des caractéristiques de l’échantillon (qui sont connues).
comment se nomme une mesure a partir de la population?
Lorsque l’on prend une mesure à partir d’une population, elle se nomme «recensement»
Qu’est-ce qu’une population?
Constitue un groupe complet ou un groupe inaccessible que nous souhaitons connaître.
Le signe est N.
Représente 100 % des informations concernant un phénomène ou un groupe.
La population représente LA VÉRITÉ ABSOLUE au sujet d’un phénomène, d’une caractéristique, de la relation entre deux variables, etc.
Théoriquement, c’est la vérité car l’information est obtenue pour toutes les personnes / entités constituant la population. IL FAUT TOUTEFOIS AVOIR UNE MESURE VALIDE ET FIDÈLE.
L’ensemble des personnes / entités auxquelles s’appliquent les conclusions d’une recherche ou d’une analyse.
«l’ensemble» d’unités (personnes, entités) généralisé par un modèle statistique (échantillon).
Donne des exemples d’échantillon
…
Quelle est la meilleure estimation de la population
Le principe sous-jacent à cette «manipulation» est que l’échantillon s’avère le meilleur estimé de la population.
Donne des exemples de population
…
Que signifie “caractéristique”?
ce sont les paramètres:
Le terme «paramètre» («parameters») est utilisé pour décrire les caractéristiques de la distribution de la population.
Les caractéristiques de la distribution d’une population ou d’un échantillon sont entre autres sa moyenne, sa variance, son écart-type, son asymétrie et son aplatissement, etc.
Qu’est-ce qu’une statistique
Le terme «statistique» est utilisée pour décrire les caractéristiques d’un échantillon OU de la distribution de la population, par l’intermédiaire d’une inférence.
Comment s’écrivent les caractéristiques (paramètres)/statistiques
Les paramètres sont décrits avec des lettres de l’alphabet Grec.
Les statistiques sont décrites avec des lettres de l’alphabet Latin.
que signifie o^2 ou s^2
variance (pop VS échantillon)
que signifie o ou s
écart-type (sigma) pop VS échantillon
p (rho) ou r
la corrélation (pop VS échantillon)
est-ce que l’inférence est une valeur sure
non, c’est une estimation, donc il y a une possibilité de faire une erreur (erreur d’inférence)
donne des exemples d’inférences (formulation)
Si nous obtenons une corrélation «r» entre x et y, mesurées à l’aide d’un échantillon, nous «inférons» que la corrélation dans la population est «r» («rho»).
Si dans notre échantillon, les personnes aux cheveux bruns sont meilleures à l’école que celles aux cheveux noirs, nous inférons que cela est aussi le cas dans la population.
Qu’est-ce qui constitue un échantillon représentatif
Puisque nous voulons répondre à une question à propos de la population et que nous n’avons accès qu’à un échantillon, il est idéal que les caractéristiques de l’échantillon soient similaires à celles que l’on retrouve dans la population
La distribution d’un échantillon représentatif devrait ressembler à la distribution de la population (la forme et les caractéristiques de la courbe sont similaires).
Comment créer un échantillon représentatif?
Il faut utiliser un échantillon aléatoire simple. Grâce aux lois du hasard, s’il contient un nombre «suffisamment» grand d’observations, l’échantillon sera la représentation la plus fidèle de la population
Les caractéristiques se distribuent de manière “normale”
Quels sont les 3 critères de l’échantillon aléatoire?
Le critère de la chance égale : chaque individu de la population a une chance égale d’être choisi.
Randomisation / échantillon aléatoire / échantillon probabiliste.
La taille de l’échantillon
Le critère de l’indépendancedes réponses : la réponse d’une personne ne doit pas être influencée par la réponse d’une autre personne.
Éthique : anonymat, confidentialité.
Vote à main levée.
Deux personnes d’une même famille dans l’échantillon.
quels sont les types d’échantillonnage aléatoire?
1) Échantillon aléatoire simple.
Chaque élément d’une population a une chance égale d’être contacté / choisi (tirage au sort), peu importe ses caractéristiques (quand nous ne les connaissons pas dans la population).
2)Échantillon aléatoire stratifié -> le plus précis (combine aléatoire et représentativité / stratification).
Les strates correspondent à des caractéristiques connues de la population (exemple de la diapo suivante avec les types de cours de statistiques).
3)Échantillon par grappes
Groupes VS individus (ex. : classe, unités administratives, etc.
c’est classe vs classe
quels types d’échantillonnage faut-il éviter pour faire des inférences?
1) Accidentel: au hazard, ex: passe devant la cafétéria. la représentation n’est pas fidèle
2)Volontaire: c’est les parricipants qui doivent s’en occuper. ex: aller sur site internet.
3)par quotas
Comment fonctionne l’échantillon stratifié?
Imaginons que dans la population: 50 % des cours sont dispensés au cégep, 40 % le sont au bacc. et 10 % le sont aux études supérieures / graduées.
L’échantillon représentatif idéal (et stratifié, serait constitué de 50 % d’étudiants de cégep, 40 % d’étudiants de bac et de 10 % d’étudiants à la maîtrise ou au doctorat choisis au hasard.
autres exemples: sexe, âges, générations,