M Q 2 Flashcards
5 étapes de la démarches inférentielle?
1- Hypothèses 2- Seuil alpha 3- Préciser le modèle statistique utilisé (+ effectuer le test) 4- Décision statistique 5- Conclusion selon le contexte
Pour statistiques inférentielles, les calculs se font sur __, mais hypothèses et conclusions sur __.
Échantillon
Population
__ correspond à ce que le chercheur veut démontrer
L’hypothèse alternative
Les tests d’hypothèse nulle prennent pour acquis que…?
H0 EST VRAIE!!!
Écart-type de la distribution d’échantillonnage = synonymes? + formule?
Erreur type, erreur standard
Sigmam (moyennes) = sigma / racine(n)
Somme des différences entre chaque score et la moyenne au carré?
Écart-type
Pour toute population ayant une moyenne mu et un écart-type sigma, la distribution des moyennes d’échantillons X de grandeur n s’approchera d’une distribution normale avec une moyenne mu et un écart-type sigma(m) = sigma / racine(n).
Théorème de la limite centrale.
Plus n est grand, plus l’écart-type de la distribution d’échantillonnage est …?
PETITE (sigma/racine(n))
___: dans la distribution d’échantillonnage, les valeurs calculées varient d’un échantillon à l’autre.
Fluctuation d’échantillonnage.
Le niveau Beta souhaité est généralement de __%, donc, puissance statistique = __%.
20%
Environ 80%
Populations… Si Ho est vraie/ fausse, c’est que les 2 échantillons viennent… ??
Fausse: viennent de 2 populations différentes (effet)
Vraie: viennent de la même population (pas d’effet)
Puissance = ???
probabilité d rejeter H0 lorsque H0 est fausse (rejeter correctement H0) (1-B)
Rejeter H0 lorsque H0 fausse…?
Puissance!! (1-B)
Que suis-je?
- Nous assure de développer une connaissance juste, car certains chercheurs arrivent à des conclusions fausses
- Repose sur la réplication des résultats
Convergence scientifique.
On ___ notre échantillon à la distribution d’échantillonnage, ce qui nous permet ___ sur la population à partir de la distribution d’échantillonnage.
COMPARE
INFÉRER
La distribution d’échantillonnage est ___ de la population
ESTIMATION
C’est grâce à quoi qu’on peut évaluer la probabilité?
Grâce à la distribution normale!!
Formule du Z?
différence des moyennes / erreur standard
Z = X-u / sigma/racine(n)
Il existe une infinité de distributions _, qui varient selon le __.
t
nombre de dl
? = X-u / sigma/racine(n) ? = X-u / s/racine(n)
Z (sigma connu)
t
On considère les __ comme étant une seule personne au niveau statistique. (sauf en ce qui a trait à __)
Individus appariés.
2 possibilités pour test t- échantillons dépendants?
- même personne mesurée à 2 reprises
- individus appariés vivant 1 seule mesure (ex. jumeaux), considérés comme une seule personne au niveau statistique
Pourquoi u1-u2 = 0 dans formule t indép?
Car, sous H0 vraie, il n’y a pas de différence entre les moyennes des 2 populations.
**Test de Levene = quoi?
Dans test t indép, pour vérifier le postulat d’homogénéité des variances.
P doit être > 0.05 !!!!! PLUS GRAND
Pourquoi on ne fait pas de test de Levene sur un test-t pour échantillons dépendants?
Il n’y a qu’une seule variance (celle de D, différences moyennes)
Pourquoi le test t pour échantillons dépendants est plus puissant que celui pour échantillons indépendants?
Parce qu’il élimine la variabilité due aux différences entre les individus. (ainsi, la valeur au dénominateur sera plus petite, ce qui fera augmenter le t => + de chances de la rejeter).
Différences de moyennes vs moyenne des différences/ différences moyennes?
Test t indép = différence de moyennes
Test t dép = différences moyennes (D)
Quand on parle de différences moyennes, on parle de…?
Test t pour échantillons dépendants (D)
C’est quoi D(barre)?
Différences moyennes. (Moyennes des différences)
Anova permet de vérifier s’il existe au moins une différence significative entre les ___.
Niveaux de traitement. (NIVEAUX de la VI).
ANOVA: même si le test permet de conclure sur les différences de ___, son calcul repose sur des comparaisons de ___.
Moyennes
Variances
Quels sont les 2 estimés de variance qu’on compare dans l’ANOVA?
- Un estimé de variance affecté par le traitement (*et l’erreur) (inter)
et un estimé de variance affecté seulement par l’erreur (intra)
__: à quel point l’appartenance au groupe affecte les données.
Estimé de variance INTER-GROUPE
Avec l’ANOVA, on compare des …?
Estimés de variance!!! (Carrés moyens)
__: à quel points les données varient NATURELLEMENT à l’intérieur d’un même groupe.
Estimé de variance INTRA-GROUPE.
INTER et INTRA réfèrent à quoi?
AU GROUPE!!!
F= __ / __ ?
Variabilité due au tx / variabilité due à l’erreur
= estimé de variance inter / estimé de variance intra.
Si les différences de moyennes sont dues à l’erreur (ANOVA), l’estimé de variance inter devrait être __ à l’estimé de variance intra.
SIMILAIRE, F = 1
Puisque l’ANOVA est un ___, on présume que ___ (__), donc la seule source de variabilité est __.
Un test d’hypothèse nulle
Ho est vraie (pas de différence)
L’erreur.
Dans l’ANOVA, les estimés de variances sont appelés…?
Carrés moyens.
À quoi cela fait-il référence?
n x variance des moyennes
CM inter
À quoi cela fait-il référence?
moyenne des variances des groupes
Cm intra
GM, c’est quoi? où?
Grande moyenne = moyenne des moyennes
Impliquée dans le calcul de CM inter.
CM inter = quoi? (formule)
n x variance des moyennes
CM intra, c’est quoi? (formule)
moyenne des variances des groupes
Théorème de la limite centrale: pour toute population ayant une moyenne u et un écart-type sigma, la distribution des ___ s’approchera d’une distribution __ avec une moyenne __ et un écart-type __.
distribution des MOYENNES
distribution normale
u
sigma / racine (n)
L’estimé de variance des scores à partir des MOYENNES est possible grâce à l’une des implications de..? (variance des scores = variance des moyennes * n)
Du théorème de la limite centrale
Lien entre l’ANOVA et le théorème de la limite centrale?
variance des scores de moyennes = n * variance des moyennes (INTER).
Variable continue vs discrète?
Continue: peut prendre une infinité de valeurs dans un continuum
Discrète: ex. 4 catégories (limité!!, pas continuum)
V/F Le test de Levene se fait seulement pour le test t pour échantillons indépendants.
FAAUX!! Il se fait aussi pour l’ANOVA PLAN SIMPLE!!
QQch de particulier avec l’homogénéité des variances pour l’ANOVA à plan simple?
Se vérifie avec le test de LEVENE.
C’est grâce à quoi que les SC et les dl sont additifs?
Au modèle linéaire général.
Le test de Levene est utilisé pour vérifier le postulat d’homogénéité des variances pour quel(s) test(s)?
- Test t indép
- ANOVA plan simple.
ANOVA plan simple; H0 et H1?
H0: u1 = u2 = u3 = u4 … OU il n’y a pas de différence SIGNIFICATIVE entre les moyennes des groupes
H1: il y a au moins une différence significative entre les moyennes des groupes!
On teste quoi avec test t indép?
La probabilité d’observer la différence entre les moyennes obtenue à l’aide d’une distribution du t sous H0 vraie.
On teste quoi avec test t dép?
Probabilité d’observer le SCORE DE DIFFÉRENCE MOYEN dans pop à l’aide distr t sous H0 vraie.
L’homogénéité des covariances, c’est dans quel test, ça?
ANOVA à mesures répétées!!.
dl pour test t éch dép?
Ex. 10 participants exposés à 2 conditions
n-1 (n = nb de participants)
Donc, dl = 9!! (vraiment regarder le nb de PARTICIPANTS, pas le nombre d’observations!)
Le type d’ANOVA à utiliser dépend… (3)?
- nombre de niveaux de VI
- type d’échantillon indép ou dép
- nombre de VD (?)
F>1 = significatif?
Non, indique que variabilité inter > intra. Il faut évalue la probabilité d’observer le f sous H0 vraie avec distr éch F pour statuer sur la signification.
Est-ce possible, à partir de la sortie SPSS, de savoir si les groupes ANOVA plan simple étaient égaux (sans les stats descriptives)?
Impossible à savoir, même si k x n = N, ça ne vaut pas dire qu’il y a effectivement n sujets dans chaque groupe (peut = n-1 dans un groupe, n+1 dans l’autre…)
Qu’est-ce que ça change d’enlever les données extrêmes pour l’ANOVA à plan simple?
Cela réduit la variabilité intra. Ainsi, le dénominateur sera plus petit, ce qui fait augmenter la valeur de F et, par conséquent, augmente la probabilité de le rejeter!
Si on voit le test t comme un RAPPORT, qu’est-ce qu’on compare avec le test t?
On compare la différence observée entre les moyennes (X-u) à l’erreur standard (s(d)/racine(n)).
CM inter ou intra a un k-1 / n-1 au dénom?
k=1 = au dénom d'inter (comme dl) n-1 = au dénom d'intra !!
___ ; indique, si H0 était vrai, à quel point il y aurait de la variaiblité entre les scores (naturellement)
CM intra.
On suppose que la covariance entre ___ est semblable.
Quel test?
Les différentes paires de niveaux de traitement.
ANOVA à mesures répétées
Variance vs covariance?
Variance: mesure la variabilité à l’intérieur d’un groupe
Covariance: mesure la relation entre 2 groupes.
Le test de Sphéricité de Mauchly permet de vérifier quoi?
- Homogénéité des variances ET des covariances.
Qu’est-ce qu’on veut finalement avec Mauchly???
On veut que ce soit NON-significatif. Donc, que p > .05. Cela indique que la matrice est sphérique, donc qu’on respecte les postulats d’homogénéité des variances ET des covariances.
2 avantages de l’ANOVA à mesures répétées?
- nécessite moins de participants
- permet de diminuer l’estimé de variance erreur (intra) en éliminant la source de variabilité associée aux sujets (SC sujets) (à condition qu’il y ait une grande différence entre les sujets => le SCsujet soit plus grand, prenne une grande partie de SCintra).
SC intra = __ + __.
SCsujets + SCerreur
V/F L’augmentation de la puissance augmente les chances de faire une erreur alpha.
Faux.
Qu’est-ce qui fait qu’on a un petit ou un grand SCsujets dans l’ANOVA à mesures répétées?
La variabilité ENTRE les sujets. Plus il y a une grande différence entre les sujets, + SCsujet est grand.
Moins il y a de variabilité entre les sujets (très semblables), + SC sujet est petit.
Avec quoi s’observe le SCsujet (dans le tableau)?
On regarde les moyennes de chaque sujet dans tous les niveaux de traitement. (droite)
Formule de l’inflation de l’erreur alpha?
a = 1 - ( 1-a ) ^c
4 tests de comparaison multiple a posteriori
Tukey, Scheffé, SNK, REGW; ces tests comparent donc toutes les comparaisons possibles.
Bonferroni = quand? = correction de combien?
- comparaisons multiples A PRIORI
- on divise le niveau alpha par le nombre de tests effectués (nb de comparaisons)
Tukey est quel type de test?
- comparaisons multiples A POSTERIORI
Quel test fait perdre de la puissance statistique?
Test t avec correction de Bonferroni (on divise le niveau alpha!)
Quelles sont les 2 options A PRIORI?
- tests t multiples (test t avec correction de Bonferroni)
- CONTRASTES LINÉAIRES.
Avantage des contrastes linéaires?
Ne se limitent pas à la comparaison de 2 moyennes; peut comparer des regroupements de moyenne.
Contrastes linéaires… = a priori ou posteriori?
Les 2 !!