Cours 12 Flashcards
Décrire comment on calcule la cote Z
Valeur de l’observation (x) - la moyenne divisé par écart type (s)
Le score standardisé (score Z) permet de savoir quoi?
à combien d’écart-type une observation se situe de la moyenne.
Dans le cas spécifique d’une distribution transformée en scores Z, la moyenne:
- devient toujours égale à … et l’écart-type, toujours égal à …
Si une observation est égale à la moyenne, son score Z = ??
Si une observation est égale à un écart-type au-dessus de la moyenne, son score
Z sera de ?
Les scores Z négatifs représentent des valeurs sous la ? .
moy =0 et écart type =1
score z = 0
score sera de 1
moyenne
En résumé, le score Z donne deux informations essentielles sur la position de 2 choses:
1) l’observation est-elle au-dessus (+) ou en-dessous de la moyenne (-)?
2) à quelle distance (en écart- type) de la moyenne se situe l’observation (la
donnée, le x)?
Qu’est ce qu’une fréquence
Nb d’observations associés à une valeur ou une catégorie
Qu’est ce qu’un ratio/rapport
relation entre 2 valeurs qu’on veut comparer
qu’est ce qu’une proportion
Les 2 quantités sont liées
numérateur est un sous-ensemble du dénominateur
Qu’est-ce qu’un taux ?
Processus dynamique, changement dans le temps
ex: le poids selon une durée dans le temps
L’inférence statistique permet de vérifier des….. et
d’utiliser des données d’échantillonnage pour faire des……. à l’ensemble d’une population
hypothèses
généralisations
Quel est le lien entre l’inférence statistique et le test d’hypothèses?
L’inférence statistique s’appuie sur la probabilité que des résultats significatifs (H1) soient applicables à la population et non le fruit du hasard ou de la chance (H0)
Plus la différence entre des groupes est grande (t, F) ou plus la corrélation entre les variables est forte (r), plus la probabilité est ……… que cette différence ou cette association existe réellement
dans la population
Élevée
Les statistiques inférentielles servent à estimer quoi?
Par rapport à quoi?
les caractéristiques d’une population (paramètres) à partir des données d’un échantillon issu de cette population
Statistique = mesure........ Paramètre = mesure ........
Échantillonnale
populationnelle
Cependant, il y a nécessairement une marge d’erreur, surtout dans les échantillons de …… …….
Petite taille
On infère un ….. à partir d’une statistique
Paramètre
inférence est basée sur la théorie des …….. et implique que l’échantillon à été tiré……… de la population (ou au moins qu’il en soit……..).
probabilités
aléatoirement
représentatif
Paramètre + erreur = …
Statistique
L’enjeu est de bien évaluer :
l’erreur
On s’appuie sur des lois de probabilités pour estimer la …….. ………. des statistiques issues de notre échantillon.
variabilité théorique
ex: estimer la moyenne populationnelle à partir d’un
échantillon. On sait que si on répétait l’échantillonnage, les différentes moyennes qu’on obtiendrait seraient :
seraient obtenues plus fréquemment que
d’autres
Théorème de la limite centrale :
• Toute somme de variables aléatoires……. et……….. distribuées tend vers une variable aléatoire gaussienne.
indépendantes
identiquement
Théorème de la limite centrale :
Plus un échantillon est…….., plus sa moyenne tend vers la moyenne populationnelle. L’erreur……. donc avec le nombre de participants.
grand
diminue
La moyenne de la distribution des moyennes échantillonnales est la ….. ……..
moyenne populationnelle
La moyenne……. est un estimateur de la moyenne
populationnelle.
échantillonnale
il faut recourir au théorème central limite pour évaluer
la ……. …….. ……..
marge d’erreur possible
Plus la taille de l’échantillon est grande, plus l’erreur type est…
petit
L’écart-type d’une distribution, appelé l’ …. ……, est un….. de l’écart-type de la population.
erreur type
ratio
Expliquer comment on calcule l’erreur type
écart type divisé par la racine carrée de la taille de l’échantillon
l’erreur-type est une mesure de l’écart « moyen » entre la
moyenne d’un……. et la moyenne……
échantillon
populationnelle
On peut donc créer des intervalles (de confiance) à partir de….. ….
l’erreur-type
l’intervalle de confiance (IC) permet de définir
une ….. …… entre les résultats d’une étude menée auprès d’un échantillon et un relevé exhaustif de la population
marge d’erreur
L’intervalle de confiance (IC) permet d’évaluer la précision de l’…… d’un paramètre statistique sur un échantillon.
l’estimation
l’intervalle de confiance Représente un…. dans lequel se situera vraisemblablement la ….. des échantillons,
intervalle
moyenne
Ce ne sera pas un intervalle de valeurs dans lequel peut
se situer la vraie valeur avec certitude, mais une…….
dans laquelle se trouve très probablement, et avec une
probabilité d’erreur que l’on…., la véritable valeur du
paramètre que l’on étudie.
zone
choisit
Pour calculer l’IC, on veut identifier des….. qui représentent les valeurs probables de la moyenne de la population autour de la moyenne estimée par l’échantillon.
Bornes
bornes = valeurs au-dessus et en-dessous de la…… de l’échantillon
moyenne
Bornes:
On obtient ces valeurs en utilisant le ….. …
score Z
Dans le cas d’une distribution normale:
• Environ 68% des valeurs sont à ….. (cb) écart-type
• Environ 95% des valeurs sont à …… écarts-types (1,96
é.t.)
• Environ 99% des valeurs sont à ….écarts-types (2,58
é.t.)
+/- 1 écart type
+/- 2
+/- 3
Comment est choisi le score Z pour le calcul d’un IC ?
Choix de l’analyste: niveau de « certitude » souhaité
• 90%, 95%, 99%
95% = cb écart type
2 (1,96)
Un intervalle de confiance de 95% représente un intervalle qui a 95% de chances d’inclure la ….. ……
moyenne populationnelle
L’IC fournit :
L’ …. des valeurs probables de la moyenne
populationnelle;
la précision de l’…..
paramétrique.
étendue
estimation
Traditionnellement, le risque maximal acceptable est fixé
à …..%. Il est appelé risque ….
5%
α
Cela sous-entend que les conclusions de l’étude seront
valables dans 95% des cas, ce qui veut dire (par exemple)
que lors du tirage de 100 échantillons, les moyennes de
95 d’entre eux se situeront dans l’….. … …
intervalle de confiance
On doit déterminer la probabilité maximale acceptable de
commettre une erreur dans l’interprétation des résultats
(du test d’hypothèse).
• Ce niveau de risque, appelé … …. ….. du test,
est noté par la lettre …
seuil de signification
α
Traditionnellement, le alpha minimal acceptable est fixé à
……. (…). Cela indique une marge d’erreur de 5%
0,05 (*)
Dans SPSS, s’exprime dans la colonne ‘……’: un ‘Sig’
inférieur à ….. est considéré comme étant significatif =
signifie qu’il y a une….. entre nos variables ou une….. entre nos groupes.
SIG
0.05
relation
différence
ERREUR DE TYPE I
L’erreur commise quand l’hypothèse nulle est……, alors qu’elle est ….
rejetée
vraie
ERREUR DE TYPE II
L’erreur commise quand l’hypothèse nulle est…., alors qu’elle est….
acceptée
fausse
erreur de type 1 = synonyme de…
erreur de type 2 = synonyme de….
Faux positif
faux-négatif
Test-T (VI….. à ….. niveaux, VD continue)
ANOVAS (VI….. à … niveaux ou +, VD continue)
nominale
2 niveaux
nominale
3 ou +
Le choix du test statistique approprié dépend de (2) :
a) l’objectif de recherche
b) la nature de x (VI) et de y (VD)
* décrire comparer
Décrire = r et c
comparer: ANOVA, test T , khi-deux
Le test T sert à établir si, sur une (des)……….(s), la différence de …… entre deux groupes est significative
variable (s)
moyenne
test t: 2 types d’échantillons
- appariés :Tester si les moyennes du même échantillon testé à 2 reprises diffèrent (ex.: pré-test/post-test)
- indépendants: Tester si les moyennes entre deux groupes diffèrent (ex.: différences de moyenne dans le
désir sexuel entre les hommes et les femmes)