M Q 2 Flashcards
5 étapes de la démarches inférentielle?
1- Hypothèses 2- Seuil alpha 3- Préciser le modèle statistique utilisé (+ effectuer le test) 4- Décision statistique 5- Conclusion selon le contexte
Pour statistiques inférentielles, les calculs se font sur __, mais hypothèses et conclusions sur __.
Échantillon
Population
__ correspond à ce que le chercheur veut démontrer
L’hypothèse alternative
Les tests d’hypothèse nulle prennent pour acquis que…?
H0 EST VRAIE!!!
Écart-type de la distribution d’échantillonnage = synonymes? + formule?
Erreur type, erreur standard
Sigmam (moyennes) = sigma / racine(n)
Somme des différences entre chaque score et la moyenne au carré?
Écart-type
Pour toute population ayant une moyenne mu et un écart-type sigma, la distribution des moyennes d’échantillons X de grandeur n s’approchera d’une distribution normale avec une moyenne mu et un écart-type sigma(m) = sigma / racine(n).
Théorème de la limite centrale.
Plus n est grand, plus l’écart-type de la distribution d’échantillonnage est …?
PETITE (sigma/racine(n))
___: dans la distribution d’échantillonnage, les valeurs calculées varient d’un échantillon à l’autre.
Fluctuation d’échantillonnage.
Le niveau Beta souhaité est généralement de __%, donc, puissance statistique = __%.
20%
Environ 80%
Populations… Si Ho est vraie/ fausse, c’est que les 2 échantillons viennent… ??
Fausse: viennent de 2 populations différentes (effet)
Vraie: viennent de la même population (pas d’effet)
Puissance = ???
probabilité d rejeter H0 lorsque H0 est fausse (rejeter correctement H0) (1-B)
Rejeter H0 lorsque H0 fausse…?
Puissance!! (1-B)
Que suis-je?
- Nous assure de développer une connaissance juste, car certains chercheurs arrivent à des conclusions fausses
- Repose sur la réplication des résultats
Convergence scientifique.
On ___ notre échantillon à la distribution d’échantillonnage, ce qui nous permet ___ sur la population à partir de la distribution d’échantillonnage.
COMPARE
INFÉRER
La distribution d’échantillonnage est ___ de la population
ESTIMATION
C’est grâce à quoi qu’on peut évaluer la probabilité?
Grâce à la distribution normale!!
Formule du Z?
différence des moyennes / erreur standard
Z = X-u / sigma/racine(n)
Il existe une infinité de distributions _, qui varient selon le __.
t
nombre de dl
? = X-u / sigma/racine(n) ? = X-u / s/racine(n)
Z (sigma connu)
t
On considère les __ comme étant une seule personne au niveau statistique. (sauf en ce qui a trait à __)
Individus appariés.
2 possibilités pour test t- échantillons dépendants?
- même personne mesurée à 2 reprises
- individus appariés vivant 1 seule mesure (ex. jumeaux), considérés comme une seule personne au niveau statistique
Pourquoi u1-u2 = 0 dans formule t indép?
Car, sous H0 vraie, il n’y a pas de différence entre les moyennes des 2 populations.
**Test de Levene = quoi?
Dans test t indép, pour vérifier le postulat d’homogénéité des variances.
P doit être > 0.05 !!!!! PLUS GRAND
Pourquoi on ne fait pas de test de Levene sur un test-t pour échantillons dépendants?
Il n’y a qu’une seule variance (celle de D, différences moyennes)
Pourquoi le test t pour échantillons dépendants est plus puissant que celui pour échantillons indépendants?
Parce qu’il élimine la variabilité due aux différences entre les individus. (ainsi, la valeur au dénominateur sera plus petite, ce qui fera augmenter le t => + de chances de la rejeter).
Différences de moyennes vs moyenne des différences/ différences moyennes?
Test t indép = différence de moyennes
Test t dép = différences moyennes (D)
Quand on parle de différences moyennes, on parle de…?
Test t pour échantillons dépendants (D)
C’est quoi D(barre)?
Différences moyennes. (Moyennes des différences)
Anova permet de vérifier s’il existe au moins une différence significative entre les ___.
Niveaux de traitement. (NIVEAUX de la VI).
ANOVA: même si le test permet de conclure sur les différences de ___, son calcul repose sur des comparaisons de ___.
Moyennes
Variances
Quels sont les 2 estimés de variance qu’on compare dans l’ANOVA?
- Un estimé de variance affecté par le traitement (*et l’erreur) (inter)
et un estimé de variance affecté seulement par l’erreur (intra)
__: à quel point l’appartenance au groupe affecte les données.
Estimé de variance INTER-GROUPE
Avec l’ANOVA, on compare des …?
Estimés de variance!!! (Carrés moyens)
__: à quel points les données varient NATURELLEMENT à l’intérieur d’un même groupe.
Estimé de variance INTRA-GROUPE.
INTER et INTRA réfèrent à quoi?
AU GROUPE!!!
F= __ / __ ?
Variabilité due au tx / variabilité due à l’erreur
= estimé de variance inter / estimé de variance intra.
Si les différences de moyennes sont dues à l’erreur (ANOVA), l’estimé de variance inter devrait être __ à l’estimé de variance intra.
SIMILAIRE, F = 1
Puisque l’ANOVA est un ___, on présume que ___ (__), donc la seule source de variabilité est __.
Un test d’hypothèse nulle
Ho est vraie (pas de différence)
L’erreur.
Dans l’ANOVA, les estimés de variances sont appelés…?
Carrés moyens.
À quoi cela fait-il référence?
n x variance des moyennes
CM inter
À quoi cela fait-il référence?
moyenne des variances des groupes
Cm intra
GM, c’est quoi? où?
Grande moyenne = moyenne des moyennes
Impliquée dans le calcul de CM inter.
CM inter = quoi? (formule)
n x variance des moyennes
CM intra, c’est quoi? (formule)
moyenne des variances des groupes
Théorème de la limite centrale: pour toute population ayant une moyenne u et un écart-type sigma, la distribution des ___ s’approchera d’une distribution __ avec une moyenne __ et un écart-type __.
distribution des MOYENNES
distribution normale
u
sigma / racine (n)
L’estimé de variance des scores à partir des MOYENNES est possible grâce à l’une des implications de..? (variance des scores = variance des moyennes * n)
Du théorème de la limite centrale
Lien entre l’ANOVA et le théorème de la limite centrale?
variance des scores de moyennes = n * variance des moyennes (INTER).
Variable continue vs discrète?
Continue: peut prendre une infinité de valeurs dans un continuum
Discrète: ex. 4 catégories (limité!!, pas continuum)
V/F Le test de Levene se fait seulement pour le test t pour échantillons indépendants.
FAAUX!! Il se fait aussi pour l’ANOVA PLAN SIMPLE!!
QQch de particulier avec l’homogénéité des variances pour l’ANOVA à plan simple?
Se vérifie avec le test de LEVENE.
C’est grâce à quoi que les SC et les dl sont additifs?
Au modèle linéaire général.
Le test de Levene est utilisé pour vérifier le postulat d’homogénéité des variances pour quel(s) test(s)?
- Test t indép
- ANOVA plan simple.
ANOVA plan simple; H0 et H1?
H0: u1 = u2 = u3 = u4 … OU il n’y a pas de différence SIGNIFICATIVE entre les moyennes des groupes
H1: il y a au moins une différence significative entre les moyennes des groupes!
On teste quoi avec test t indép?
La probabilité d’observer la différence entre les moyennes obtenue à l’aide d’une distribution du t sous H0 vraie.
On teste quoi avec test t dép?
Probabilité d’observer le SCORE DE DIFFÉRENCE MOYEN dans pop à l’aide distr t sous H0 vraie.
L’homogénéité des covariances, c’est dans quel test, ça?
ANOVA à mesures répétées!!.
dl pour test t éch dép?
Ex. 10 participants exposés à 2 conditions
n-1 (n = nb de participants)
Donc, dl = 9!! (vraiment regarder le nb de PARTICIPANTS, pas le nombre d’observations!)
Le type d’ANOVA à utiliser dépend… (3)?
- nombre de niveaux de VI
- type d’échantillon indép ou dép
- nombre de VD (?)
F>1 = significatif?
Non, indique que variabilité inter > intra. Il faut évalue la probabilité d’observer le f sous H0 vraie avec distr éch F pour statuer sur la signification.
Est-ce possible, à partir de la sortie SPSS, de savoir si les groupes ANOVA plan simple étaient égaux (sans les stats descriptives)?
Impossible à savoir, même si k x n = N, ça ne vaut pas dire qu’il y a effectivement n sujets dans chaque groupe (peut = n-1 dans un groupe, n+1 dans l’autre…)
Qu’est-ce que ça change d’enlever les données extrêmes pour l’ANOVA à plan simple?
Cela réduit la variabilité intra. Ainsi, le dénominateur sera plus petit, ce qui fait augmenter la valeur de F et, par conséquent, augmente la probabilité de le rejeter!
Si on voit le test t comme un RAPPORT, qu’est-ce qu’on compare avec le test t?
On compare la différence observée entre les moyennes (X-u) à l’erreur standard (s(d)/racine(n)).
CM inter ou intra a un k-1 / n-1 au dénom?
k=1 = au dénom d'inter (comme dl) n-1 = au dénom d'intra !!
___ ; indique, si H0 était vrai, à quel point il y aurait de la variaiblité entre les scores (naturellement)
CM intra.
On suppose que la covariance entre ___ est semblable.
Quel test?
Les différentes paires de niveaux de traitement.
ANOVA à mesures répétées
Variance vs covariance?
Variance: mesure la variabilité à l’intérieur d’un groupe
Covariance: mesure la relation entre 2 groupes.
Le test de Sphéricité de Mauchly permet de vérifier quoi?
- Homogénéité des variances ET des covariances.
Qu’est-ce qu’on veut finalement avec Mauchly???
On veut que ce soit NON-significatif. Donc, que p > .05. Cela indique que la matrice est sphérique, donc qu’on respecte les postulats d’homogénéité des variances ET des covariances.
2 avantages de l’ANOVA à mesures répétées?
- nécessite moins de participants
- permet de diminuer l’estimé de variance erreur (intra) en éliminant la source de variabilité associée aux sujets (SC sujets) (à condition qu’il y ait une grande différence entre les sujets => le SCsujet soit plus grand, prenne une grande partie de SCintra).
SC intra = __ + __.
SCsujets + SCerreur
V/F L’augmentation de la puissance augmente les chances de faire une erreur alpha.
Faux.
Qu’est-ce qui fait qu’on a un petit ou un grand SCsujets dans l’ANOVA à mesures répétées?
La variabilité ENTRE les sujets. Plus il y a une grande différence entre les sujets, + SCsujet est grand.
Moins il y a de variabilité entre les sujets (très semblables), + SC sujet est petit.
Avec quoi s’observe le SCsujet (dans le tableau)?
On regarde les moyennes de chaque sujet dans tous les niveaux de traitement. (droite)
Formule de l’inflation de l’erreur alpha?
a = 1 - ( 1-a ) ^c
4 tests de comparaison multiple a posteriori
Tukey, Scheffé, SNK, REGW; ces tests comparent donc toutes les comparaisons possibles.
Bonferroni = quand? = correction de combien?
- comparaisons multiples A PRIORI
- on divise le niveau alpha par le nombre de tests effectués (nb de comparaisons)
Tukey est quel type de test?
- comparaisons multiples A POSTERIORI
Quel test fait perdre de la puissance statistique?
Test t avec correction de Bonferroni (on divise le niveau alpha!)
Quelles sont les 2 options A PRIORI?
- tests t multiples (test t avec correction de Bonferroni)
- CONTRASTES LINÉAIRES.
Avantage des contrastes linéaires?
Ne se limitent pas à la comparaison de 2 moyennes; peut comparer des regroupements de moyenne.
Contrastes linéaires… = a priori ou posteriori?
Les 2 !!
2 conditions pour un contraste linéaire?
Formule?
- Avoir au moins un a différent de 0
- Somme des ak = 0
(a= coefficient de contraste)
L = a1X(barre)1 + a2X2 + a3X3 … + ak(xk)
Un contraste linéaire est un exemple de test…
De comparaisons multiples A PRIORI.
Dans les contrastes linéaires, a réprésente quoi?
Le coefficient de contraste. (0, -1, 1 …)
Avec un contraste linéaire, quel paramètre on obtient?
Et degrés de liberté??
Un t (ou un F!!)
Si test t, dl = (n1 + n2) - 2
Si c’est un F, F= CMcontraste / CMintra
- 1 dl au numérateur (contraste)
- k(n-1) dl au dénominateur
2 types de comparaisons a posteriori?
- Procédure à étape unique (calculer une seule valeur critique) ex. Tukey, Scheffé (Bonferroni aussi, mais a priori)
- Procédure à étapes multiples (soit step-up ou step-down) (Newman-Keuls)
Quel type de test effectue toutes les comparaisons pairées possibles? exemples de tests?
Les tests de comparaisons multiples a posteriori (Tukey, Scheffe, SNK, REGW Q et F)
Nommer les tests a posteriori en ordre de puissance.
Newman-Keuls (+ puissant) => REGW Q et F => HSD de Tukey => Scheffé (le moins puissant)
- À noter; le Games-Howell n’est pas classable en termes de puissance…
Newman-Keuls?
test de comparaisons multiples a posteriori
le plus puissant
à étapes multiples
HSD de Tukey?
test de comparaisons multiples a posteriori
le + utilisé
se limite au n égaux
à étape unique
REGQ Q et F?
test de comparaisons multiples a posteriori
+ puissant que Tukey, mais moins que Newman-Keuls
** fonctionne pour n inégaux!!
Games-Howell?
test de comparaisons multiples a posteriori
** effectue une correction si le postulat d’homogénéité des variances n’est pas respecté.
inclassable en termes de puissance
Scheffé?
test de comparaisons multiples a posteriori
le plus sévère
** ne se limite pas aux comparaisons pairées.
Test de comparaisons multiples a posteriori le + puissant? Le moins puissant?
Plus : Newman-Keuls
Moins : Scheffé
Test de comparaisons multiples a posteriori qui se limite aux n égaux? qui peut comparer pour n inégaux?
égaux seulement = HSD de Tukey
REGW Q et F pour n inégaux
Test de comparaisons multiples a posteriori qui permet de faire une correction si variances non homogènes?
Games-Howell
Test de comparaisons multiples a posteriori inclassable en termes de puissance?
Games-Howell
Test de comparaisons multiples a posteriori qui ne se limite pas aux comparaisons pairées?
Scheffé.
Où se situe le SCsujet sur SPSS pour ANOVA répétées?
Quelle boîte doit-on regarder pour le F, le SCerreur?
- dans la boîte du bas « inter-sujet » => source : erreur
- Les infos de l’ANOVA à mesures répétées se trouvent dans la première boîte, soit effets INTRA-sujets.
- ** ATTENTION, le F s’appelle D
Pourquoi la puissance n’est pas toujours augmentée dans une ANOVA à mesures répétées vs une ANOVA à plan simple?
- S’il n’y a pas assez des variabilité entre les sujets (sujets trop semblables), le SC intra sera petit. Autrement dit, la variabilité des sujets ne joue pas assez un « grand rôle » dans SC intra.
+ ON ENLÈVE non seulement le SCsujets du SCintra, mais AUSSI LES DLsujets.
** les dls intras vont donc toujours diminuer!! (c’est pour ça que la puissance peut aussi baisser!)
Qu’est-ce qu’on veut qui soit non significatif (p>.05)?
Le test de sphéricité de Mauchly (ANOVA répété) pour vérifier le postulat des variances et des covariances.
V/F L’analyse de variance à mesures répétées peut s’effectuer avec des échantillons indépendants.
Faux. Ce sera toujours des échantillons DÉPENDANTS pour l’ANOVA à mesures répétées, même si ce sont des individus appariés (considérés comme un seul et même individu, donc DÉPENDANT).
Le Sc sujet réfère a quoi?
À la variabilité ENTRE LES SUJETs, pas d’un même sujet!!!
Comment nomme-t-on la possibilité d’avoir des gens qui sont statistiquement considérés comme étant une seule et même personne?
- INDIVIDUS APPARIÉS.
V/F Un des avantages majeurs de l’analyse de variance à mesures répétées, c’est de réduire la Somme des Carrés intra, en y retirant la variabilité entre les mesures d’un même sujet.
FAUX!!! ON RETIRE LA VARIABILITÉ ENTRE les sujets! SC inter-sujets)
Les individus appariés sont considérés dépendants ou indépendants?
DÉPENDANTS!!!
Principal désavantage de l’ANOVA à mesures répétées?
Risque d’effet de rémanence / d’apprentissage!
Dans un texte de résultats scientifique, on ne nomme que les résultats significatifs.
NON, nommer aussi tout ce qui n’est pas significatifs (donner les résultats de tous les tests qu’on a fait!)
Effet principal vs effets simples?
Les effets principaux: on observe les effets d’un des facteurs en ignorant complètement l’autre.
EFFETS SIMPLES: on observe l’effet d’une variable (VI) à chacun des niveaux de l’autre.
- ex. effet du sexe pour condition 1, 2, 3,
- effet de la condition 1 pour femme, hommes…
- Pourquoi est-ce qu’on peut retirer SCsujet de l’erreur pour l’ANOVA à mesures répétées?
Puisque ce sont les MÊMEs sujets, la variabilité des sujets de la condition 1 EST LA MÊME que la variabilité des sujets de la condition 2. Il n’y a pas de différence entre les individus qui peut venir jouer sur les résultats.
Il faut que l’ANOVA soit significative pour…?
Effectuer un test de comparaisons multiples a posteriori (REGW, Tukey, Scheffé, SNK).
On teste toutes les comparaisons pairées possibles pour..?
Un test de comparaisons multiples a posteriori.
= a x ((a-1)/2)
Nombre de comparaisons pairées possibles?
nb = a x ((a-1)/2)
a étant le nombre de niveaux de tx (ex. 4 conditions)
** pour 4 niveaux, ça donne 6 !!!
Exemples de tests a priori?
Bonferroni, DUNN-SIDAK, HOLM.
Les contrastes linéaires sont un exemple de test de comparaisons multiples…
a priori et a posteriori
L’ANOVA est basée sur le …?
Modèle linéaire général,
C’est grâce au modèle linéaire général que…?
Les SC et les dls peuvent s’additionner!
Exemple d’erreur résiduelle?
Erreur au niveau de l’instrument, fluctuation T…
Formule du score d’un individu? (ANOVA plan simple)
+ définition de chaque terme
et quels paramètre sont comparés dans l’ANOVA?
Xij = u + aj + eij u = moyenne de la population (constante) aj = VARIABILITÉ due à l'effet de la condition j eij = variabilité due au sujet i dans la condition j (erreur)
Dans l’ANOVA, on compare la variabilité due à l’effet de la condition (aj) à l’erreur.
Formule du score d’un individu? (ANOVA à mesures répétées)
+ définition de chaque terme
Xij = u + aj + (pi)i + eij u = moyenne de la population (constante) aj = variabilité due à l'effet de la condition j (pi)i = variabilité due à l'effet spécifique du sujet i** eij= variabilité résiduelle
** à noter que (pi)i est retirée!!!
Quel paramètre est retiré de la formule de définition d’un score pour l’ANOVA à mesures répétées?
(pi)i => Variabilité due à l’effet spécifique du sujet i.
Quelle constante se retrouve dans les équations de définition d’un score pour ANOVA?
u; moyenne de la population.
- à noter, représente l’ORDONNÉE à l’origine.
Formule du score d’un individu? (ANOVA à plan factoriel)
+ définition de chaque terme
Xij = u + aj +Bk + (aB)jk + ei(jk) aj = variabilité due à l'effet du niveau j de A (VI) Bk = variabilité due à l'effet du niveau k de B (VI) aB(jk) = variabilité due à l'effet conjoint des niveaux j et k, l'interaction de aj et Bk ei(jk) = erreur résiduelle due à l'effet du sujet i dans le niveau j de la VI (A) et dans le niveau k de la VI (B)
Qu’est-ce qui représente l’ordonnée à l’origine dans la formule de définition d’un score?
u; moyenne de la population
2 avantages de l’ANOVA à plan factoriel?
- Généralisation + large (on amène des précisions à notre étude, ce qui augmente la validité externe)
- tests d’interaction entre les facteurs (VIs)
Les VIs sont appelées… et représentés par …
Facteurs
ou traitements
- représentés par une majuscule.
Comment écrirait-on le 2e niveau de la variable indépendante / facteur / traitement ?
a2 (minuscule)
Les combinaisons des niveaux de plusieurs facteurs sont appelé…?
Cellules (ex. croisement entre a1 et b1)
On appelle facteur ou traitement…?
Les VI. (A, B)
Est-ce qu’un plan factoriel 2x3 équivaut à un plan factoriel 6 ?
Non XD!
p.s. les chiffres représentent les niveaux des 2 VIs.
Que teste l’effet d’interaction?
Si l’effet de la variable A est le même pour chacun des niveaux de traitement de la variable B et si l’effet de la variable B est le même pour chaque niveau de la variable A (VI)
Si l’ANOVA plan factoriel était à mesures répétées, le CMintra serait le même.
NON, le dénominateur changerait. C’est pour l’ANOVA plan factoriel à mesures NON répétées qu’on utilise tjrs le même dénominateur (CMintra).
Tester l’effet principal d’une VI revient à …?
Faire une ANOVA à plan simple. ex. vérifier s’il y a une différence entre les hommes et les femmes / entre les différentes conditions. (Y a-t-il une différence significative entre les différents niveaux de ma VI?)
dl pour interaction?
dl intra pour ANOVA factoriel?
(a-1)(b-1)
ab(n-1), où n = nombre de cellules (a*b)
Dans l’ANOVA à plan factoriel, le dl inter se décompose en…
dl B
dl B
dl AB (interaction)
Visuellement, l’interaction ressemble à quoi?
Les courbes des effets de la variable A sur les différents niveaux de la variable B se CROISENT!! (ne sont pas parallèles!)
Une interaction significative nous indique quoi? (2)
- qu’il faut nuancer notre interprétation des effets principaux
- que l’effet de la VIA n’est pas le même à chaque niveau de la VIB (et vice-versa!) et/ou!!
On pourrait ne pas détecter l’effet principal, mais tout de même trouver des effets simples significatifs si…?
L’effet de notre variable est inverse pour le niveau 1 et 2 de l’autre… « X », puisque l’effet principal est en fait la moyenne des effets de A sur B1 et B2! (donnerait une ligne droite = non sign. pour effet principal)
___ permet d’examiner l’effet d’un facteur à un/des niveaux spécifiques d’un autre facteur.
L’analyse d’effets simples.
Les analyses d’effets principaux et d’effets simples ressemblent à quel autre test?
ANOVA à plan simple (nous dit qu’il y a un effet, mais ne nous dit pas entre quelles moyennes se situe la différence!
Correction de Bonferroni pour les effets simples?
a(global) / (a+b) (alpha / nombre de comparaisons)
** le alpha global
Différence entre correction de Bonferroni pour test de comparaisons multiples vs effets simples?
c.multiples: a / nb de comparaisons (ex. .05/3)
effets simples: a global (somme des alpha) / (a+b)
Un effet simple décompose à la fois ___ et ___.
L’effet d’interaction
L’effet principal utilisé
Les dl des effets simples ne sont pas ajoutés au total… plutôt, ils sont égaux à …?
ex. somme des dl des effets de A sur les trois niveaux de B = dl interaction + dl A (puisque l’effet simple décompose à la fois l’effet d’interaction et l’effet principal utilisé)
Quand on fait un test d’effets simples, ne pas oublier de…
DIVISER LE NIVEAU ALPHA en utilisant la correction de Bonferroni!! alpha global/(a+b)
Dans SPSS, pour ANOVA pf, on regarde le total ou le total corrigé??
On regarde le total corrigé! (En cas de doute, regarder les dls, on prend celui dont les dl = N-1!)
D = F **
Le alpha global dans correction de Bonferroni pour les effets simples… il additionne quoi??
Le alpha global additionne les tests F (alpha de A, de B et de AB). (sera donc presque toujours à 0.15 (si 2 VIs))
__: effet produit par l’une des variables du plan factoriel SANS tenir compte des autres variables manipulées
Effet principal
Définition de l’effet principal? exemple?
Effet produit par l’une des variables du plan factoriel SANS tenir compte des autres variables manipulées (VIs) Par exemple, effet du sexe => différence significative entre les hommes et les femmes en ce qui a trait à la VD (dépression)?
V/F En présence d’un effet d’interaction, l’interprétation des effets principaux est inutile.
FAUX!! Elle n’est pas inutile. Il faut toutefois nuancer notre interprétation des effets principaux puisque l’effet d’interaction nous indique que l’effet de A n’est pas le même pour chaque niveau de B et vice-versa.
REMINDER!!!! Dans l’examen, pour l’ANOVA, indiquer les résultats NON SIGNIFICATIFS AUSSI!!!!
Oui, oui, donner les résultats pour TOUS TOUS TOUS les tests effectués!!!
Tests non paramétriques?
Tests qui ne rencontrent pas les postulats de base, tel que la normalité de la distribution
** Limites des tests non paramétriques (6)
- Beaucoup moins puissants
- Se limitent aux comparaisons simples (ex. pas d’équivalent pour ANOVA plan factoriel!)
- Ne peuvent pas tester l’interaction
- Perte d’information (en transformant les données en rangs)
- pas spécifiques (H0: les éch proviennent du même échantillon / on ne teste pas directement des moyennes..)
- pas systématiques (tests indépendants les uns des autres, tables bizarres!)
** Avantages des tests non paramétriques? (4)
- pas besoin de distribution normale (de forme de distribution particulière), puisque les tests non paramétriques ne nécessitent pas d’estimer de paramètre
- pas affectés par les données extrêmes, car + sensibles à la médiane qu’à la moyenne
- PEUVENT ÊTRE UTILISÉS SUR DE PETITS ÉCHANTILLONS
- calculs relativement simples
V/F Tests non paramétriques; les données sont classées en rangs, tous groupes confondus.
Vrai!
Pour les tests non paramétriques, ce sont les __ que l’on compare pour vérifier s’il existe une différence entre les groupes.
Sommes de rangs.
H0 test Wilcoxon?
H0: les 2 échantillons ** proviennent de populations identiques, ayant une tendance centrale identique.
Wilcoxon: on teste la probabilité…
D’obtenir la différence observée avec N données (total, distribution varie en termes du nombre de données)
Ws réfère à quel test?
Wilcoxon pour échantillons indépendants.
T réfère à quel test?
Wilcoxon pour échantillons dépendants.
Combien de groupes pour Wilcoxon?
2
Ws = quelle valeur? n1 = quel groupe?
= la somme des rangs du plus petit groupe. Si n égaux, = la plus petite somme des rangs.
** plus petit groupe
Quel test est équivalent au Wilcoxon indép?
U de Mann-Witney
** Comment rejeter H0 pour Wilcoxon indép?
Il faut que notre Ws soit INFÉRIEUR
Quel test est équivalent au U de Mann-Witney?
Wilcoxon indép.
V/F Pour rejeter H0 avec Wilcoxon indép, Ws doit > Ws critique.
Faux. Ws doit être
Nos résultats risquent d’être faussés dans le Wilcoxon indép si…?
Solutions? (2)
- Si nos plus gros rangs se retrouvent dans le plus petit groupe… puisque Ws = le Wilcoxon considère que les plus petits rangs se retrouvent dans le plus petit groupe…
Solutions;
- classer les données en ordre décroissant (1=plus grand) et calculer un nouveau Ws => W’s.
- se servir des propriétés symétriques et utiliser cette formule pour W’s; W’s = 2W(barre) -Ws
Pour l’épreuve d’hypothèse du U de Mann-Witney, on transforme le Ws en __ (pour de grands échantillons, c’est tjrs ce que SPSS fait).
Z.
Sur SPSS, pour Wilcoxon, on prend …?
Et pour U de Mann-Witney?
- La signification asymptotique
- sig asymptotique si n > 25, exacte si n
Quelle valeur est basée sur l’approximation d’un test Z pour Wilcoxon indép (SPSS)?
- La signification asymptotique (1ère)
VD pour Wilcoxon dépendant??
Différence entre les données pour chacune des paires de données (A-B)
ex. MODIFICATION DE LA TENSION CORPORELLE.
H0 Wilcoxon dép?
Les échantillons proviennent de populations identiques.
VD Wilcoxon dépendant?
différence, modification
ex. VD= modification de la tension corporelle.
Procédure Wilcoxon dépendant?
1) différences (A-B)
2) classer en rangs les DIFFÉRENCES, EN VALEUR ABSOLUE!
3) faire la somme des rangs pour T+
4) faire somme des rangs pour T-
5) La statistique T est le plus petit T!
Logique Wilcoxon dépendant?
Si le programme est efficace, la différence devrait être POSITIVE! (ex. 140 lbs => 120 lbs) Les T+ devraient être > que les T-.
Comment rejete-t-on le T?
T doit être
Le T et le Ws doivent être __ que leurs valeurs critiques respectives.
PLUS PETITES!!
V/F Pour les tests non paramétriques équivalents aux tests t et à l’ANOVA, les fréquences des données sont utilisées comme variable dépendante.
FAUX, ce sont les RANGS des données qui son utilisées comme VDs.
Rang dépend du score…
La VD pour les tests non paramétrique est…
Le rang des données.
La correction pour les rangs égaux a pour effet de …?
Et la valeur corrigée, c’est laquelle?
Augmenter légèrement la probabilité de rejeter H0. (p plus petite = plus de chances d’être
Est-il possible de faire des tests a posteriori avec les tests non paramétriques?
ouiii
Équivalent non paramétrique du test t dép?
Wilcoxon pour échantillons pairés
Pour les __ échantillons, les distributions de Ws et de T sont approximativement normales. On les transforme donc en scores Z.
Grands.
Tests non paramétriques équivalents à ANOVA à plan simple?
À ANOVA à mesures répétées?
- Kruskal-Wallis
- Friedman
Quelle est la statistique pour Kruskal-Wallis?
H
Avec Kruskal-Wallis, on compare quoi?
Des MOYENNES DE RANGS.
Lorsque le n (test Kruskal-Wallis) est ___, on utilise la table du Khi-Carré
n > 5
Correction pour le H (rangs égaux)?
Fait augmenter la puissance (car dénom = 1-…, sera plus petit que 1!)
On veut que le H soit…
> que la valeur critique khi carré (n>5)
Pour comparaisons multiples, K-W => R sur ___
Friedman => R sur __
On compare ces chiffres EN VALEUR ABSOLUE à …
C’est significatif si…?
moyennes de rangs
sommes de rangs
-> LA DIFFÉRENCE CRITIQUE.
Si la valeur, en valeur absolue, est > que différence critique.
Quelle est la statistique pour Friedman?
Fr ou X^2 f (Khi carré f)
Les rangs sont distribués par __ pour Friedman.
- Les rangs égaux aussi =pour __.
Sont distribués PAR SUJET
ex. sujet 1 1 3 4 2
sujet 2 1 2 4 3 ….
POUR UN MÊME SUJET!!
On calcule la somme des rangs pour …
Chacune des CONDITIONS.
Avec Friedman, on utilise quelle table?
Celle du Khi carré
** Avec Friedman, on veut vérifier si la différence entre les __ de rangs est significative.
vs K-Wallis = si __ de rangs est significative
- SOMMES
- MOYENNES
Tests de comparaisons multiples pour K-W et Friedman?
valeur absolue (K-W = moyennes, Fr = sommes) => calcule une DIFFÉRENCE CRITIQUE. On veut que notre valeur calculée soit > que la différence critique.
Sait-on où sont les différences pour K-W et Friedman?
Non, on ne peut que conclure qu’il y a au moins une différence significative entre les GROUPES.
Le U de Mann-Witney équivaut à quoi?
Wilcoxon indép.
Test de Sobel =
1) Combien de dl pour le test t?
2) Quelle valeur critique pour grand échantillon?
1) N-3
2) 1.96
**Comment on décrit l’influence de la Vmod?
Plus la Vmod est élevé, plus l’influence de la VI sur la VD est grande et varie selon le niveau de la VI.
La régression logistique, c’est quand…?
- (pendant non paramétrique de régression simple et multiple)
VD dichotomique et VI discrète, continue ou dichotomique
** Contrairement au test t, on parle, avec la régression logistique, de PRÉDICTION !
Qui suis-je; je s?uis un test qui est très utilisé dans le monde médical pour prédire les risques de pathologie
La régression logistique
v/f; En régression logistique, comme en régression multiple, le Y prédit représente la valeur exacte de Y pour un sujet donné.
FAUX !
Régr log; la transfo logistique ramène les valeurs entre 0 et 1, ce qui correspond à la PROBABILITÉ POUR UN SUJET DONNÉ!
Une échelle de Likert est une échelle __ ?
ordinale
Test de Mauchly a rapport à quoi?
- ANOVA à mesures répétées