Examen 2 Flashcards
v/f ; Les tests d’hypothèse nulle nous donnent la probabilité d’obtenir ces échantillons s’ils proviennent d’une même population
Vrai
THN nous indique quoi ?
La probabilité d’obtenir un tel échantillon SI H0 EST VRAIE (s’il n’y a pas de différence!!)
Une p de
Si H0 est vraie (s’il n’y a pas de différence avant / après dans la population), il y a moins de 5% de chances que j’observe ce résultat
En réalité h0 est toujours ___. Donc, impossible de faire une erreur ___.
Fausse.
Beta.
Une des critiques aux THN est le faible contrôle de l’erreur ___. En effet, ajouté à l’autre type d’erreur (__), le risque que le chercheur commette une erreur grimpe à __.
Beta (ne pas trouver d’effet alors qu’il y en a un)
Alpha 5%
Total = 60%
Nommer des critiques aux THN?
- Faible contrôle de l’erreur B
- Choix du seuil alpha = arbitraire
- Ignorance des probabilités a priori
Solutions à certains défauts des THN?
- Mesures de tailles d’effet
- Présentation graphique des données avec indice de dispersion
- Inférence Bayesienne
Le choix du seuil alpha est arbitraire. Ce seuil force une vision ____ des problèmes plus complexes.
Dichotomique. (Significatif / Non-sig)
Qu’est-ce qu’un résultat marginalement significatif?
Un résultat très près de .05
Que peut-on faire pour que notre résultat marginalement significatif devienne significatif? (3 poss)
- Ajouter des données
- Choix d’un test plus puissant
- Retrait des données extrêmes
v/f; Un p de 0.00001 indique un meilleur résultat / plus grande différence qu’un p de 0.05
Faux. Pas de taille d’effet!
Dans le rapport F, où se situe la taille d’effet?
Au numérateur (CM inter)
CM inter / CM intra
Si la probabilité est > .05, on ___ H0.
ON NE REJETTE PAS.
=> On ne peut pas accepter H0; il faudrait avoir exploré raisonnablement toutes les options.
Différentes tailles d’effet?
- Taille d’effet brute (Xpost - Xpré)
- Taille d’effet standardisée = d de Cohen((Xpost-Xpré / é-t moyen)
- Mesures d’association, ex. éta-carré
Taille d’effet standardisée? Avantage?
= d de Cohen
/ é-t moyen ou é-t poolé
- permet de comparer divers travaux (ex. méta-a) vu l’indépendance des échelles de mesures
Éta-carré?
= estimé de la taille d’effet; proportien de variance de VD expliquée par niveaux de VI.
éta-carré = estimé pour échantillon
oméga-carré = estimé pour population
Présentation graphique des données? 2 possibilités…
- ESM; erreur standard des moyennes
- Intervalles de confiance; IC.95 = ESM x tcrit
ESM = quoi?
« Erreur standard des moyennes »
= écart-type de la distribution d’échantillonnage (s/racine(n))
- l’erreur standard des moyennes est pondérée selon la taille de l’échantillon
- ESM = estimé de l’écart-type des moyennes qui seraient obtenues avec une série de répétitions de l’expérience dans les mêmes conditions
ESM au lieu de é-t permet de …
Faire une inférence auprès de la population
Formule de l’ESM?
s/racine(n)
Formule de l’intervalle de confiance?
IC.95= ESM x tcrit .05(dl)
On aura donc; X +/- IC
L’intervalle de confiance s’ajoute au-dessus de la moyenne et s’enlève en-dessous…
ex. 150 +/- 7 (IC)
Lorsqu’on diminue la puissance, on __ B.
Augmente
Puissance = inverse de B (1-B)
Inférence Bayesienne; probabilité que…
Qu’une hypothèse soit vraie
v/f L’inférence Bayesienne pourrait être vue comme l’inverse des THN. Pourquoi?
Vrai
- Pcq, il regarde la probabilité que l’hypothèse soit vrai
v/f ; L’inférence Bayesienne indique la force de la probablilité
Vrai
v/f Le facteur de Bayes ne renseigne pas sur la force de l’effet
Faux
Quel exemple utilise l’inférence Bayesienne?
Les méta-analyses
L’inférence Bayesienne tient compte…
Des connaissances accumulées. Probabilités selon ce qui a déjà été fait.
Désavantage de l’inférence Bayesienne?
Calculs complexes!
Erreur Alpha vs Beta?
- Alpha; rejet H0 alors que h0 est vraie
(dire qu’il y a un effet alors qu’il n’y en n’a pas) - Beta; accepter H0 alors que h0 est fausse.
(dire qu’il n’y a pas d’effet alors qu’il y en a un)
** La puissance d’un test dépend de ? (4)
- Variabilité erreur
- Niveau alpha
- Taille de l’échantillon
- Taille d’effet
Parler de la puissance vs variabilité erreur?
+ il y a de bruit dans les donnée (variabilité), moins de test sera puissant
+ groupe homogène augmente la puissance.
Groupe homogène __ la puissance.
augmente
Dans le rapport F, variabilité erreur …
Se trouve au démom (CM intra)
Arbre;
Plusieurs groupes — indép — 1 facteur (VI) —
1 ==> paramétrique ?
2 ==> non para?
1) Anova à plan simple
2) Kruskal-Wallis
Arbre;
Plusieurs groupes — indép — plusieurs facteurs —
1 ==> paramétrique ?
1) Anova à plan factoriel
Arbre;
Plusieurs groupes — Dép — 1 facteur (VI) —
1 ==> paramétrique ?
2 ==> non para?
1) Anova à mesures répétées
2) Friedman
Puissance vs taille d’effet?
+ l’écart entre les niveaux de traitement est grand, plus le test aura de chances de détecter un effet significatif, donc + il sera puissant
Puissance vs niveau alpha?
+ le niveau alpha est petit (conservateur), plus la puissance diminue
(augmente chances erreur B)
Puissance vs taille de l’échantillon?
- il y a de sujets, - il y a de dls au dénom et - le test sera puissant
** diminuer la taille de l’échantillon modifie aussi l’étendue des données
Qu'est-ce qui arrive à B si on diminue la taille d'effet? le niveau alpha? la taille de l'échantillon? la variabilité erreur?
Dans tous les cas, la zone B s’agrandit. Le B est plus grand, on a donc + de chances de faire une erreur B (dire qu’il n’y a pas d’effet alors qu’il y en a un).
Calcul des fréquences attendues pour Khi carré d’indépendance statistique calculé comme ajustement?
NON ! Tient compte des 2 variables, c-a-d des totaux des colonnes et des lignes
À absolument inclure dans les résultats pour Khi carré d’indép statistique ? (2)
- Afin de vérifier si ….
- Il y a une dépendance statistique entre les variables X et Y.
- Avec un alpha de 0.05, les résultats montrent que….
Dl dans résultats Khi carré d’indép?
(L-1)(C-1) = celui dans SPSS !!!!!
Résultat et conclusion pour Khi carré d’indép non significatif?
- avec un alpha de .05, les résultats montrent qu’il y a une indépendance statistique entre X et Y.
… Il semble donc qu’il n’y ait pas de différence de satisfaction entre les groupes. On conclut que les gens des trois groupes ont la même satisfaction.
De quel test est-il question?
« On veut savoir si X est associé à une plus grande probabilité de Y »
Rapport de chances!
Différence entre Khi carré d’ajustement et d’indépendance statistique?
Ajustement= 1 VI (ex. sauce à spag)
Indép stat = 2 VIs (ex. âge et opinion politique)
Khi carré d’ajustement = pour vérifier quoi?
S’il y a une différence significative entre la proportion d’observations dans les différentes catégories et la proportion d’observations attendues
- Vérifier si la différence entre les fréquence observées et les fréquences attendues est réelle ou attribuable au hasard.
Khi carré d’ajustement = quel type de variables?
Catégorielles (nominales)
Formule du Khi carré?
X2 = somme (O-E)^2 / E
O = fréquences observées pour 1 catégorie E = fréquences attendues pour 1 catégorie
Degrés de liberté pour Khi carré d’ajustement ?
k-1 (k = nombre de catégories)
H0 et H1 pour Khi carré d’ajustement ?
H0 : fréq obs = fréq attendue
H1 : fréq obs =/ fréq att
Est-ce qu’il y a unilatéral et bilatéral pour Khi carré d’ajustement ?
Non.
Comment on écrit le résultat : X^2 …
X^2 (dl, N= __) = ___, p
Fréquences attendues = tjrs hasard?
Non, peut aussi être théorique
Dans ce cas, on veut vérifier si les résultats observés supportent la théorie
Fréquences théoriques attendues… Quel résultat?
Les résultats observés supportent ou non la théorie
Si acceptation de H0 (pas de différence), => supporte la théorie stipulant que …)
Résultats Khi carré d’ajustement ?
Les résultats montrent que les hommes n’ont pas identifié leur sauce à spag préférée de manière aléatoire. Ils semblent donc préférer ….
Sur SPSS, différencier les 2 types de Khi carré ?
Khi carré d’ajustement = Khi deux
Khi carré d’indép stat = Khi deux Pearson, gros tableau croisé!
Khi carré d’indépendance statistique, on veut vérifier quoi?
Si la distribution d’une variable catégorielle dépend de la distribution d’une autre variable catégorielle à partir d’une table de contingence.
Si la variable A est influencée par la variable B
Khi carré d’indépendance statistique, on s’intéresse à des ….
Ressemble bcp à __?
Distributions de fréquences
L’anova à plan factoriel (interaction)
Différences entre Khi carré d’ajustement et Khi carré d’indépendance statistique?
Khi carré d’indépendance statistique;
– les valeurs de fréquences attendues doivent être calculées en fonction des 2 variables !
Eij = CixL1/N (Eij = fréquences attendues)
(N= nombre total observations)
– les dls doivent aussi être calculées en tenant compte des 2 variables; dl = (C-1)(L-1)
Table de contingence… ça a rapport à quoi ça ?
Au Khi carré d’indépendance statistique.
Donc, dans le test Khi carré d’indépendance statistique, le calcul tient compte de…
Des totaux des lignes et des colonnes (proportions globales)
Comment on calcule avec le Khi carré d’indépendance statistique?
On calcule les fréquences attendues pour chaque cellule (Eij = CiLi/N), ce qui nous donne la fréquence attendue pour chaque cellule, puis on calcule le X^2 qui est la somme des (O-E)^2 /E !
On parle de dépendance statistique quand ??
Quand les fréquences observées sont significativement différentes des fréquences attendues.
Résultats Khi carré d’indépendance statistique ?
Afin de tester l’hypothèse selon laquelle…
Les résultats montrent qu’il y a une dépendance stat entre ….
Les résultats observés appuient donc le fait que ….
OU
La répartition de la variable A influence la répartition de B
Si non significatif; il y a une indépendance statistique, la distribution de la variable A n’influence pas la répartition entre les catégories de l’autre.
Dans Khi carré d’indépendance statistique, quand les fréquences observées sont significativement différentes des fréquences attendues …?
On parle de DÉPENDANCE statistique
Conditions d’utilisation du Khi carré? (3)
- Données sur échelle intervalle ou ratio
- Normalité (respecté si toutes les fréquences attendues sont d’au moins 5) - SPSS tolère 20%
- Indépendance des observations
(Inclusion des non-occurences)
Inclusion des non-occurences ?
Parfois, l’une des catégories d’un facteur est l’absence de réponse (ex. avoir acheté qqch ou non).
Il est donc possible, à tort, de faire un Khi carré d’ajustement alors que nous sommes en présence de 2 facteurs de classification (2 VIs).
Différence entre corrélation et mesure d’association?
Corrélation = au moins un variable avec gradation (rang ou continu)
- Mesure d’association = variables sans gradation, catégorielles. (nominale)
Rapport des mesures d’association avec le Khi carré?
Le Khi carré permet seulement de dire s’il y a ou non une association. Le mesures d’association viennent compléter, nous permettent de connaître le DEGRÉ d’association
Quelles sont les différentes mesures d’associations en lien avec le Khi carré?
- phi ou phi de Cramer
- Rapport de chances
- Kappa de Cohen
Phi
Phi de Cramer ou C ou V
Quelles formules et types de variables?
Ce sont des mesures d’association
- Phi = quand on a 2 variables catégorielle dichotomique (quand plan 2 x 2)
Phi = Racine (X^2/N)
- Phi de Cramer = + de 2 catégories (pour au moins 1 variable)
PhiC = Racine (X^2 / N(k-1)) (k= + petite valeur entre C et L)
Le Phi s’interprète comment?
Comme un coefficient de corrélation (Pearson) = descriptif.
v/f ; la probabilité qui est associée au Phi de Cramer est la même que Khi carré.
Vrai!
Le p sera le même :) Donc, pas besoin de faire de test de Khi carré si on vient de faire le phi de Cramer.
Sur SPSS, Phi…
Crosstabulation, sym
Rapport de chance ?
= mesure d’association
chances d’être dans la catégorie A1 plutôt que A2 si on est dans catégorie B.
Rapport de chances paticulièrement utile pour…?
Les tables 2 X 2. Se fait aussi pour + de 2 catégories, mais on parlera de chances d’être classé dans catégorie A1 par rapport aux chances d’être dans toutes les autres catégories.
Se faire un exemple de tableau et calcul de rapport de chances si besoin
:)
A/B
C/D
Rapport de chances = A/B / C/D
Kappa de Cohen ?
Variables?
= mesure d’association
mesure d’accord inter-juges
Variables catégorielles; 1 - juges, 2 - catégories évaluées par les juges.
Kappa de Cohen exploite quoi?
Les tables de contingences
Qui suis-je? Je suis une mesure d’accord inter-juges et une mesure d’association.
Kappa de Cohen
Qu’est-ce qu’un accord inter-juges?
On veut s’assurer que l’évaluation des différentes personnes (juges) est comparable.
Qu’est-ce qui exploite les tables de contigences?
Le Kappa de Cohen
Kappa de Cohen permet de comparer les pourcentages d’accord en tenant compte de ______.
L’effet du hasard.
Comment sont calculées les fréquences attendues pour le Kappa de Cohen?
Fr = CxL / N
(imaginer tableau - on prend la cellule d’intérêt sur la DIAGONALE, et on trouve la fréquence attendue en multipliant le total de la colonne correspondante et le total de la rangée, divisés par le grand total! - en bas à droite!)
Formule du Kappa?
Fo = quoi? * Fe = quoi?
K = (Somme Fo - Somme Fe) / (N - Somme Fe)
Somme (Fo) = somme des accords (diagonale)
Somme (Fe) = somme des fréquences attendues.
Quelle est la différence entre simplement calculé le pourcentage d’accord et faire un Kappa de Cohen?
Le calcul de pourcentage d’accord ne tient pas compte du hasard.
ex. = 100 x (15+3+3) / N (15, 3 et 3 sont les chiffres de la diagonale)
tandis que le Kappa de Cohen tient compte de l’effet du hasard, de la répartition réelle des sujets.
Le Kappa sera plus faible!
Que signifie un Kappa de 0 ?
Et un Kappa inférieur à 0 ? (négatif)
- 0 = l’association entre les décisions prises n’est pas plus forte que le hasard
- tendance contraire dans les réponses… Ex. quand les juges ont des critères d’évaluation opposés!
Barème Kappa presque parfait ?
0.81 et +
Hypothèse nulle pour régression linéaire simple?
Linéaire multiple?
Contribution unique au modèle?
Simple: H0 : r^2 = 0
Multiple: H0 : R^2 = 0
Contribution unique; H0 : bi = 0
Mesure d’association possible pour Khi carré d’ajustement? Pourquoi?
Non, car on a une seule variable ! Une mesure d’association est une mesure entre 2 variables.
v/f; La régression permet d’établir une relation causale?
Non, pas plus que la corrélation !
** Les termes de la droite de régression sont choisis comment?
De façon à minimiser Somme(Y - Y^)^2 (la somme des résidus au carré).
Il s’agit d’un ajustement par moindres carrés.
Pour quel test est-il question d’unilatéral vs bilatéral?
Corrélation de Pearson
En contexte bilatéral, qu’est-ce qu’il y a de particulier avec la conclusion ?
On ne PARLE PAS DE LA DIRECTION DE L’EFFET !
Juste dire « les résultats de l’analyse de corrélation révèlent qu’il y a une RELATION LINÉAIRE SIGNIFICATIVE entre … ET… »
Quels éléments à rapporter régression multiple ?
- Les résultats montrent un lien significatif, F= …, entre la qualité de vie et le modèle composé de 5 prédicteurs…
- Lien fort (R^2 - .69), modèle permet d’expliquer 69% de la variance du facteur qualité de vie
- Contributions uniques (tests t avec bi) ==> SIG ET NON SIG!!
- Ordre de contribution des prédicteurs (B = …)
Résultats régr multiple hiérarchique?
meilleur modèle ?
Les résultats de l’analyse de régression multiple montrent qu’à lui seul, le p1 permet d’expliquer 40% (R^2 = .40) de la variance de la variable prédite. Bien que faible, cette relations est significative, F = ….. . L’ajout du p2 au modèle permet d’expliquer 1 % supplémentaire de la variance du modèle ( R^2 = ..). Bien qu’encore faible, cette relation est toujours significative, F = ……
** Dans le 3e modèle proposé, la contribution unique du facteur 3 n’est pas signitificative. Le meilleur modèle de prédiction est donc le 2e modèle.
=> On continue jusqu’à ce que la contribution d’un facteur ajouté ne soit plus significative!!!
v/f ; Le W de Kendall est l’équivalent de la corrélation de Spearmon à 3 niveaux ou plus et s’interprète de la même manière…
FAUX.
Première partie - OK, mais ne s’interprète pas de la même manière ! Le W doit être transformé en un estimé du r de Spearman moyen
En régression multiple, une ANOVA (test F) est utilisé pour tester l’hypothèse que..?
R^2 est significativement différent de 0.
Corrélation vs mesure d’association?
Corrélation; une des 2 variables présente une gradation
Mesure d’association : variables sans gradation ni ordre (catégorielles)
Quel type de corrélation: 2 variables continues ?
R de Pearson
Quel type de corrélation: 1 variable dichotomique et 1 variable continue ?
Corrélation bisérialle de point
Quel type de corrélation: au moins une variable rangée (ou non respect de postulat de normalité ou homogénéité Pearson) ?
R de Spearman
Quel type de corrélation: + de 2 séries de rangs?
W de Kendall
Quel type de mesure d’association : 2 variables dichotomiques ?
Phi
Quel type de mesure d’association : 1 variable dichotomique et une catégorielle (+ de 2 catégories)
= plus de 2 catégories dans au moins une variable
Phi de Cramer
Quel type de mesure d’association : chances d’obtenir B plutôt qu’A ?
Rapport de chances
Quel type de mesure d’association : comparé d’accord inter-juges ?
Kappa de Cohen
r permet seulement de …?
population?
Décrire l’échantillon
Un test inférentiel doit être effectué pour déterminer si la relation est présente dans la population.
r de Pearson = quelle distribution? dls?
Distribution du t de Student avec N-2 dl
Barème r de Pearson?
- 20-0.39 faible
- 40-0.69 modérée
- 70-0.89 forte
- 90 + très forte
Coefficient de corrélation = mesure standardisée de ..?
la covariance entre 2 variables.
Formule du r de Pearson?
r = COVxy / SxSy
= degré auquel les 2 variables varient ensemble / degré auxquelles les 2 variables varient séparément
r^2 est appelé…
Coefficient de détermination
** Conditions d’utilisation du r de Pearson? (4)
- relation linéaire entre X et Y
- normalité de la distribution
- homogénéité des variances
- 2 variables aléatoires et continues
Le diagramme de dispersion permet de vérifier quoi?
Les postulats d’homogénéité, le linéarité, de normalité et la présence de données extrêmes.
Limites de la corrélation?
- sensible aux relations linéaires seulement
- influencée par certains facteurs tels que les données extrêmes et l’étendue (+ étendue = + chances + force)
- ne permet pas d’établir de lien causal
Solution au problème de la corrélation de ne pas pouvoir établir de lien causal?
Corrélation partielle et semi-partielle
r Pearson; parle-t-on de bilatéral ou unilatéral?
OUI !!
** attention, quand on parle de bilatéral, on ne peut mentionner la direction de l’effet dans la conclu; juste dire qu’il y a une relation linéaire significative.
H0 et H1 pour r Pearson?
H0 : Pxy =0
H1 : Pxy =/ 0 (bilatéral!!!)
Quand on a une variable dichotomique et une continue, on parle de…?
Corrélation bisérialle de point
Rbp se calcule comme Pearson? S’interprète pareil ?
Calcul OUI
interprétation; attention au signe; Rbp ;
- Relation positive indique un résultat + élevé pour 1
- Relation - indique résultat plus élevé pour 0
Quelles sont les corrélations basées sur les rangs?
- Spearman
- W de Kendall
Corrélation de Spearman (rs)?
= analogue du r de Spearman (approximation), mais données en rangs
=> on calcule un score de différence pour CHAQUE SUJET
C’est quoi le D dans corrélation de Spearman?
Différence de rang assignée à chaque sujet pour les variables X et Y.
v/f ; rs s’interprète de la même manière que r Pearson
Vrai!!
v/f ; rs se met aussi au carré?
Vrai!!
Différence Spearman et W Kendall?
Spearman = juste pour 2 séries de rangs (ex. 2 juges)
W de Kendall = pour + de 2 séries de rangs!! (ex. + de 2 juges!)
W représente quoi?
Un ratio de variance des totaux des colonnes / variance max possible des totaux des colonnes…
Comment on interprète le W?
On le transforme en rs(barre) = r de Spearman MOYEN.
*** Attention de ne pas utiliser le W pour parler de la corrélation!
moyenne de W avec ajustement
rs(barre) = k W-1 / k-1
Corrélation vs régression linéaire simple - similitudes?
- 2 observations / sujet
- on s’intéresse au lien entre les variables
Corrélation vs régression linéaire simple - différences?
- Corrélations = variables aléatoires, pas pour régression (prédicteurs, VIs) = variable fixe
- Corrélation = si variables reliées / Régr = prédiction
Formule régression simple? a et b = quoi?
Y^ = bx+ a
a= o.o b= pente!
Comment les coefficients sont-ils choisis?
De façon à minimiser la somme des résidus au carré
E(Y-Y^)^2 => ajustement par moindre carrés
Qu’est-ce qu’un résidu ?
Différence entre Y et Y prédit, se calcule pour chaque observation
Quels sont les SCs de la régression et que représentent-ils?
- SC total : E (Y-Ybarre)^2 = variabilité totale Y
- SC rég : E (Y^-Ybarre)^2 = variabilité de Y expliquée par X
- SC res : E (Y-Y^)^2 = variabilité de Y non expliquée par X (variabilité erreur / résiduelle)
** à noter que ces SCs ont aussi une propriété d’additivité
v/f ; Comme pour l’anova, le régression permet de calculer des SCs qui représentent la variabilité des données.
OUI, SCtotal, reg et res.
Dls pour régression?
- dl total = n-1
- dl reg = p
- dl res = n - p - 1
Logique de la régression ressemble à celle de ??
L’ANOVA! F = variabilité de Y expliquée par X / variabilité de Y non expliquée par X.
Si X explique un niveau suffisant de Y, on conclut que X permet de prédire Y dans la population
Dans régression, F = ….
CMreg / CMres = (SCreg / dl) /(SCres / dl) = (SCreg/p)/(SCres/n-p-1)
** Formule du r^2 ?
r^2 = SC reg / SC total !!!!
Différence régression linéaire simple vs multiple?
Simple = 1 seule VI Multiple = plusieurs VIs (prédicteurs) = Xi
Parcimonie?
On cherche le modèle qui permet d’expliquer le + de variance avec le + petit nb de prédicteurs
** conditions utilisation régression (simple ou multiple)?
- Relation linéaire
- Variable se distribuent normalement
- homogénéité des variances
- *** indépendance des résidus
2 approches rég multiple?
Algèbre scalaire, matricielle
Droite de régression multiple?
Y^ = bo + biXi …
Condition unique à la régression?
Indépendances des résidus.
On vise à minimiser, avec la droite…?
La somme des résidus au carré
R^2 = pourcentage…?
de variance expliqué par LES prédicteurs
Comment sont choisis les coefficients bi?
De façon à minimiser la somme des résidus au carrés (ajustement par moindres carrés)
v/f ; Les b permettent d’identifier les variables qui contribuent le + au modèle? Pourquoi?
Faux, c’est les Beta.
=> Pcq les prédicteurs sont p-e sur des échelles différentes, ça ne peut pas se comparer.
Principe des coefficients de régression standardisés? Beta
- Transfo des b en scores Z, fait en sorte que l’o.o. devient 0 et les prédicteurs peuvent être mis en ORDRE en termes de contribution
Formule pour passer de b à B?
Bi = bi x si / so (so = é-t de la VD)
B est une mesure ___ qui permet de dire quelles variables contribuent le +, mais pas __.
** important de mettre en __…
Ordinale
Pas combien de plus (ne fait que les mettre en ordre)
VALEUR ABSOLUE !!
R = quoi?
= coefficient de régression multiple
- corrélation entre Y et Y^
- corrélation entre VD et l’ensemble des prédicteurs
R^2 = quoi?
Coefficient de détermination (rég multiple); proportion de variance de la VD expliquée par prédicteurs
H0 : R^2 = 0 => est-ce que le modèle prédit significativement?
C’est une ANOVA qui permet de tester cette hypothèse!
R^2 = SCreg / SCtotal
Les hypothèses des régression sont testées par… ?
Des ANOVA (F) !
v/f ; Il exite une formule avec laquelle on peut arriver à notre F à partir du R^2 ?
Vrai. Relation étroite entre les R^2, les SCs et le F.
v/f ; Il existe un coefficient de détermination (R^2) ajusté. Pourquoi?
Vrai.
Car le R^2 normal tend à être surestimé avec petits échantillons et bcp prédicteurs.
Le R^2 ajusté tient compte de la taille de l’échantillon
Avec quel test on vérifie la contribution significative de chacun des prédicteurs?
Test t !!!
t = bi / sbi :)
h0 ; bi = 0
v/f ; Il y a une relation étroite entre les R^2, les SCs et le F.
Vrai!
Limites de la régression multiple ?
- permet pas d’établir de relation causale
- validité des prédicteurs
- taille de l’échantillon; besoin de 15 sujets / VI et N doit > p+50
- très sensible aux valeurs extrêmes
- Colinéarité
Régression multiple; - taille de l’échantillon; besoin de __ sujets / VI et N doit > p + 50
15 sujets / VI !
Colinéarité = quoi?
Multilinéarité et singularité?
- à quel point nos différents prédicteurs sont corrélés entre eux
multicolinéarité = relations fortes entre les prédicteurs singularité = corrélation parfaite entre 2 prédicteurs (construits trop semblables)
Corrélation partielle vs semi-partielle?
Partielle; on enlève la variance de X1 expliquée par X2 et la variance de Y expliquée par X2
Semi-partielle ; on enlève seulement la variance de X1 expliquée par X2
V/f ; Les corrélations semi-partielles et partielles peuvent être mises au carré?
Vrai.
Nommer les différentes méthodes de sélection des prédicteurs?
standard ou classique (enter)
statistique ou pas à pas - backwards (par élimination)
hiérarchique
Méthode classique?
- ts prédicteurs entrés simultanément
- chaque préd est évalué pour ce qu’il apporte d’unique au modèle
- la variance partagée par plusieurs prédicteurs est considérée dans le modèle, mais PAS ATTRIBUÉE À UN PRÉDICTEUR EN PARTICULIER.
v/f ; Il est possible d’avoir un prédicteur dont la contribution est non significative malgré que celui-ci soit fortement corrélé avec la variable prédite?
Vrai!
Le fait que notre F soi sign en régression multiple nous indique que la valeur de R^2 ….?
Pourra être inférée à la population
rsp^2 ; coefficient de détermination semi-partiel indique quoi en rég multiple ?
indique la contribution unique ; ex. de 18%
B nous indique l’ordre des contributions uniques… mais quelle mesure nous indique la proportion de variance expliquée par cette contribution?
Coefficient de détermination semi-partiel rsp^2
où on a exclu la variance de X1 expliquée par X2
Régression statistique / pas às pas / stepwise
ordre choisi par SPSS en fonction de la contribution. Quand facteur ajouté n’améliore plus le modèle, on arrête!
=> permet d’obtenir modèle parcimonieux
inverse = méthode backwards
L’ajout du p2 permet d’expliquer 2% de variance supplémentaire… (à condition que sa contribution soit significative!!!)
Régression hiérarchique ?
Choix du chercheur selon la théorie, 1er facteur entré = le plus important !!!
On attribue au premier facteur toute la variance qu’il partage avec Y, et on attribue à X2 ce qui reste….
De quelle méthode est-il question? « on attribue au premier facteur toute la variance qu’il partage avec Y, et on attribue à X2 ce qui reste….»
Méthode hiérarchique.
Droite de régression = meilleur ajustement __ entre X et Y.
Linéaire.
Quand on veut vérifier « l’apport de la VI », on regarde quel test / quelle valeur?
Le t.
Test de Sobel =
1) Combien de dl pour le test t?
2) Quelle valeur critique pour grand échantillon?
1) N-3
2) 1.96
**Comment on décrit l’influence de la Vmod?
Plus la Vmod est élevé, plus l’influence de la VI sur la VD est grande et varie selon le niveau de la VI.
La régression logistique, c’est quand…?
- (pendant non paramétrique de régression simple et multiple)
VD dichotomique et VI discrète, continue ou dichotomique
v/f; En régression logistique, comme en régression multiple, le Y prédit représente la valeur exacte de Y pour un sujet donné.
FAUX !
Régr log; la transfo logistique ramène les valeurs entre 0 et 1, ce qui correspond à la PROBABILITÉ POUR UN SUJET DONNÉ!
Une échelle de Likert est une échelle __ ?
Ordinale
Test de Mauchly a rapport à quoi ?
- ANOVA à mesures répétées
Comment comparer le t de la médiation complète pour le test de Sobel? et dls?
grand échantillon = 1.96 (Z)
t = N-3dl
1 ère étape modération?
On centre les données et on crée les variables d’interaction
Modération, qu’est-ce qui doit être correlé?
VI x Vmod avec;
VI
Vmod
VD (centrées)
On parle de modération quand…?
VI x Vmod = sign
Vmod seule PAS SIGN
(Régression multiple VI, Vmod et VIxVmod pour prédire VD)
Modération, équation de régression.
OUI,
elle inclut, de la régression multiple. Entrer tous les facteurs dans l’équation, mm si pas signitifcatifs.
Visualisation modération?
Pour voir l’effet de la Vmod sur l’influence de VI sur VD (prendre valeurs basses, neutres et élevées).
À mentionner dans résultats modération?
- création d’une variable d’interaction centrée (corr avec autres)
- Régr multiple, contritubutions uniques…
- analyse visuelle de l’interaction montre que + la Vmod augmente,
But de la régression logistique; prédire une variable prenant des valeurs ___.
Binaires
La régression multiple donne un Y prédit pour chaque sujet?
NON, donne une probabilité
Les coeff de régresion dont estimés en utilisant la méthode …?
Méthode du maximum de vraisemblance.
2 tests qu’on fait en reg logistique?
- Regr multiple (X^2) – on compare le modèle avec les préd au modèle sans préd pour voir s’il prédit mieux
- test e Wald (contribution unique au modèle)
Avantages rég log?
- peu ou pas de postulats à respecter
- permet de postuler des relations non linéaires
Désavantages rég log?
- moins de puissance
Valeurd du X^2 en rég logistique?
Modèle sans prédicteur - avec prédicteur
Dans l’interprétation du rapport de chances, SPSS fait la prédiction sur …?
LE DEUXIÈME FACTEUR !!
« multiplie pas 6.22 le risque de maladie mentale (=1) »
pour chances 1 sujet; remplacer ds éq logchances => __ bi; e^bi (e exposant la valeur) = ..?
ExpB SPSS = rapport de chance
e^bi = Cette personne a 6.22 x plus de chance de détérioration (2) que de ……