Examen final Flashcards
Avec quel type de variable utilise-t-on avec le chi-2
2 variables catégorielles (qualitatives / nominales et ordinales)
Quelle est l’utilité du chi-2?
Vérifier si 2 variables sont indépendantes et permet de voir si la relation est significative. Comparaison entre la distribution des fréquences observées et des fréquences attendues.
Quelles sont les conditions nécessaires du chi-2
- Test flexible «non paramétriques»
- 2 variables catégorielles
- Min. de 5 cas/ cellule
Indice de force du chi-2: Phi ?
Tableau 2x2
Indice de force du chi-2: C de contingence
Nombre de colonnes = nombre de rangées
Indice de force du chi-2: Gamma
2 variables ordinales
Indice de force du chi-2: V de cramer
Tous les autres types
Ce que l’on doit mentionner dans l’interprétation du chi-2?
- Présence ou non d’une relation (équation: X2 (ddl) = X2 (valeur), p)
- Rejet ou non de H0 (la mentionner)
- Présenter les différences selon les résultats
- Force de la relation (indice de force =…)
Avec quel type de variable utilise-t-on le test de moyennes / test t?
- VI : nominale dichotomique ( groupes)
- VD: continue / intervalle (quantitative)
Quelle est l’utilité du test de moyennes / test t?
Comparer des groupes pour vérifier si les moyennes de groupes sont statistiquement différentes
Dans un test des moyennes / test t, quelle est la différence entre un test bilatéral et unilatéral?
- Bilatéral: On test les côté de la courbe, seuil de singification/2
- Unilatéral: On test seulement un côté de la courbe
Qu’est-ce que le t?
- Dans le test des moyennes/ test t, c’est le seuil critique selon le degré de liberté. dl = (n1 + n2) -2
- Il faut que la valeur du t obtenue soit supérieure à la valeur critique pour pouvoir rejeter H0
Quels sont les tests paramétriques du test t?
- Test t pour échantillon indépendant: groupes indépendants (noirs/caucasiens)
- Test t pour échantillons appariés: mêmes personnes, mais à des moments différents
Quel est le test non paramétrique du test t?
U de Mann Whitney
Quelles sont les conditions nécessaires pour réaliser un test t?
- Variable quantitative distribuée normalement
- Si pas normal, moins problématique quand: n plus grand ou égal à 50 et min. de 15-30 cas par groupe
- Homogénéité de la variance (homoscédasticité); Test de Levene
Expliquer l’homogénéité de la variance (test t)
- On veut une homogénéité de la variance entre les groupes, donc on veut garder H0 où il n’existe pas de différence significative entre les variance
- Le test de Levene doit être non significatif p> 0.05
Test t: vérifier si relation significative
- Voir sig. et t (valeur) dans tableau «test échantillons»
- Lire 2e ligne si Levene significatif (variance hétérogène)
Test t: vérifier la direction de la relation
Comparer les moyennes des groupes dans le tableau statistique de groupe
Test t: vérifier la force de la relation
Utiliser l’Êta carré qui représente également le % de la variation de la VD expliquée par la VI
Ce que l’on doit mentionner dans l’interprétation du test t
- Existence ou non d’une différence (équation: t(dl1, dl2)=t(valeur), p)
- Rejet ou non de H0 (mentionner)
- Préciser la différence entre les groupes (moyenne«x», écart type«s»)
- Êta carré, force de la relation et % expliqué
- Homogénéité de la variance (Test de Levene: p)
Avec quel type de variable utilise-t-on ANOVA?
- VI: nominale/ordinale avec +2 modalités (3 groupes indépendants ou plus)
- VD: Continue (quantitative)
Quel est l’utilité de l’ANOVA?
Permet de comparer la moyenne de groupe pour 3 groupes indépendants ou plus. Test t compare seulement la différence entre 2 groupes à la fois. Plus on fait de test, plus on a de chance de trouver une relation significative
Quel est le test non paramétrique de l’ANOVA?
Kruskal-Wallis
Comment mesure-t-on les différences entre plus de 2 groupes (ANOVA)?
- On n’utilise pas directement la moyenne, mais la variance des distributions.
- Le test est bas. sur le ratio de la variance inter et intra groupe
Qu’est-ce que la variance intergroupe? (ANOVA)
C’est la différence entre la moyenne du groupe et la moyenne totale. Taux de récidive entre Arrestation; Médiation; Conjoint quitte lieux
Qu’st-ce que la variance intragroupe? (ANOVA)
C’est la différence entre le résultat de l’individu et la moyenne du groupe auquel il appartient
Qu’est-ce que l’on veut dans un test de l’analyse de la variance (ANOVA)
- Homogénéité de la variance intragroupe (Levene)
- Hétérogénéité de la variance intergroupe
Quel est la valeur de l’ANOVA dans les tableaux?
F
Quels sont les conditions nécessaires pour réaliser l’ANOVA?
- VD = distribution normale
- Min. de 15 à 30 cas /groupe
- Homogénéité de la variance (homoscédasticié)
Dans ANOVA, quoi observer si homogénéité de la variance INTRAgroupe (levene= p> 0.05)
- Interpréter F
- Rejet ou non de H0 (si F = p> 0.05)
- Comparaison post hoc avec SCHEFFE
Dans ANOVA, quoi observer si hétérogénéité de la variance INTRAgroupe (levene= p
- Interpréter WELCH
- Rejet ou non de H0 (si WELCH = p>0.05)
- Comparaison post hoc avec TAMHANE
Force de la relation avec ANOVA?
Êta carré
Sens de la relation avec ANOVA?
- Comparaison post hoc si relation significative
- Les * dans le tableau indiquent où sont les différences
Ce que l’on doit mentionner dans l’interprétation d’ANOVA?
- Respect du postulat d’homogénéité (Levene)
- Différence significative entre les groupes (selon F ou Welch: F(dl1, dl2) = F (valeur), p)
- Rejet ou non de H0 (mentionner)
- Force de la relation et % expliqué (Êta carré)
- Tests de comparaison post hoc selon scheffe ou tahmane
- Mentionner les différences
Quel type de variable utilise-t-on avec la corrélation?
2 variables quantitatives (+ force et sens)
Quelle est l’utilité de la corrélation?
Étape nécessaire avant de faire une analyse multivariée, elle permet de connaître l’association entre les variables dépendantes et indépendantes à l’étude. Mesurent-elles la même chose? (colinéarité)
Quelles sont les conditions nécessaires à la corrélation?
- Distribution normale de 2 variables quantitatives
- Pas de valeurs extrêmes problématiques
- Linéarité de la relation
- Min. de 30 effectifs / cas par variable
Comment observer la normalité d’une variable?
- Inspection des données univariées (asymétrie, applatissement +/- 3.29)
- Histogramme
Que faire avec des valeurs extrêmes?
- Peuvent exargérer ou minimiser l’association
- Les éliminer si problématique
- Utiliser le rho de Spearman (non paramétrique)
Comment observer la linéarité?
À l’aide du diagramme de dispersion (nuage de points)
Que faire si l’un des postulats de la corrélation n’est pas respecté?
Utiliser le test non paramétrique: rho de Spearman
- Utilisation du rang plutôt que de la valeur. Vient détecter l’existence et le sens d’une relation peu importe sa forme.
Que faire lorsque les 4 postulats de la corrélation sont respectés?
Utiliser le R de Pearson (examine comment les variables covarient)
Comment calculer le degré de liberté dans la corrélation?
dl = n (analyse) - 2
Comment observer la force et le sens de la relation dans la corrélation?
r de Pearson ou rho de Spearman selon le respect ou non des 4 postulats. Varie de -1 à 1. Si valeur négative, relation négative
Ce que l’on doit mentionner dans l’interprétation d’une corrélation
-Existence d’une association entre les variables (équation: r(dl)= valeur r, p
Qu’est-ce qu’une régression simple?
Lorsque les postulats de la corrélation s’appliquent, permet de représenter la relation par une droite et de faire des prédictions. Permet de connaitre la force explicative de la VI sur la VD.
Dans une régression simple, que regarde-t-on pour connaitre la force explicative de la VI sur la VD?
Le coefficient de corrélation qui est le r de Pearson au carré, similaire à l’Êta carré
Quelle est l’équation de la régression simple?
Y = a + b(x)+ e où a est la constante, b la pente et e le résidu
Quel type de variable utilise-t-on pour la régression multiple?
- VI: les variables indépendantes quantitatives ou dichotomiques
- VD: Variable quantitative
Quelle est l’utilité de la régression multiple?
Améliorer la prédiction de la VD en prenant en considération l’effet de plusieurs variables indépendantes (effet unique et combiné). Permet d’inclure une variable contrôle.
Dans la régression multiple, qu’est-ce qu’une relation artificielle?
Quand l’entrée d’une autre variable ne permet plus d’établir une relation significative, alors qu’il y en avait une au départ
Dans la régression multiple, qu’est-ce qu’une relation conditionnelle?
Les variables ne sont pas significativement reliées, mais quand on entre une nouvelle variable elles deviennent significatives entre elles
Quelles sont les conditions nécessaires à la régression multiple?
- Min. de 20 cas par variable (n/ nombre de variables inclusent dans le modèle)
- Normalité de la distribution
- Linéarité de la relation entre les variables quanti. (nuage de point)
- Absence de colinéarité et de multicolinéarité (rho de Spearman et/ou r de Pearson et indice de tolérence)
Quelle est la valeur de l’indice de tolérance pour la multicolinéarité?
Varie entre 0 et 1, problématique si plus petit ou égal à 0.30
Dans le régression multiple, comment évaluer la force du modèle?
R2 ajusté
Dans la régression multiple, comment évaluer la force et le sens des variables significatives (effet unique)?
Bêta
Comment déterminer si le modèle est significatif?
Dans le tableau ANOVA, voir colonne sig,
Ce que l’on doit mentionner dans l’interprétation d’une régression multiple
- Le modèle peut-il prédire singificativement (F(dl1, dl2) = valeur du D, p; R2 ajusté =)
- Rejet de HO
- Indicateurs explique
- Respect des postulats
- Prédicteurs significatifs (bêta =)
- Sens et force des relations
- Variable avec le plus d’impact