Recherche quanti 2 Flashcards
Cours 10 - Chi 2
🍬Chi 2 utilité et utilisation : Vérifier si 2 variable quali sont indépendante l’une de l’autre. H0 = existe pas différence entre groupes à étude (indépendance variable).
- Présence simultané des modalités de 1er variable et 2eme variable. - tableau croisé: répartition effectifs à travers modalités des 2 variables combinées. - test du chi carré : statistique inférentielle. Effet observé de VI sur VD - relation statistiquement significative ? (p<0.05)
🍬Conditions nécessaire : test flexible non paramétrique. 1. Deux variable quali, 2. Minimum de 5 effectifs théorique, de distribution effectifs et nombre catégories.
🍬Tableau croisé : pouvons nous rejeter hypothèse nulle supposant qu’il n’existe pas de relation entre deux variable à l’étude ? - quel % basé sur chance devrait être attendu ? - quelle différence % assez importante pour permettre rejet h0?
🍬Test indépendance chi-2 : statistique inférentielle : permet connaitre si diff observé entre groupe est statistiquement significative ou non.
- Comparaison entre distribution des fréquences observé (FO) et distribution des fréquences attendues (fréquentes théorique, FT)
🍬Déterminer valeur critique : valeur obtenue avec calcul permet savoir si diff observé est réelle ou hasard / erreur. Plus élevé, plus diff importante entre ce qui est attendu et observé. = + chance que relation soit statistiquement significative.
- Table valeur chi-2. x2 = 13.67 et ddl (degré liberté) = 2. seuil = 0.05 etc.
🍬Étapes : 1. mentionnez H1. (non-direct puis directionnel)
2. Test statistique (respect postulat ?),
3. Rejet ou non-rejet de H0 (si 0.05 ou 0.01 ou 0.001. Rejet ou non-rejet relation significative ou pas entre les deux variables)
4. Si rejet (stat significative) : a) précisez direction relation, différence groupes observé.
b) précisez force.
Indice force : Phi (2x2) OU C de contingence (mm nombre cat 4x4) OU Gamma (2 variable sont ordinales) OU V de crammer (si autre marche pas)
- Se baser sur le tableau qui sera donné pour interprétation.
5. Présentez et interprétez résultats : Si résultat différent ou sens contraire hypothèse recherche, doit apporter pistes d’explication. Pk attendiez relation significative et pk pas observé? Quelles sont différences possibles entre étude et les autres qui pourrait expliquer différence? Échantillons ? Variable ? Recodage?
Cours 11 - Moyenne T
- Retour types d’analyse statistiques: tester pour les différences de groupes sur une mm variable.
Ex. Existe-t-il une diff au niveau du nombre de crimes commis selon sexe ? H : x=5, F x=3, diff de 2 crimes. Est-ce assez ? À partir de quand = différence réelle ?
🎁Test de moyenne / test t - But et utilité : Comparer des groupes (Vérifier si les moyennes de 2 groupes sont statistiquement différentes)
- Variable à l’étude : VI (variable nominal dichotomique). VD (continue quanti)
🎂Deux scénarios possibles : 1) Aucune différence quant à moyenne des populations / groupes à études. (Homme both 3) 2) Réelle différente quant à moyenne population / groupe étude. (Homme = 3 et homme =5). - C’est la VALEUR DE LA STATISTIQUE INFÉRENTIELLE T qui permet de le savoir. Seuil de signification du tes alpha (p< .05, .01, .001)
🎂Valeur critique du t : Déterminer la zone critique (tableau p.344, slide 3). Ex. Pour dl 40 et seuil à 0.05, valeur critique du t = 2.02. - Test bilatérale (vs unilatéral) = car bilatéral, teste pour les 2 côtés de courbe et devons diviser le seuil de signification en 2 = 0.05/2 =0.025 de chaque côté.
- Si la valeur du t obtenue est de 1.96, on peut pas rejeter l’hypothèse nulle. (Voir image slide 3).
- Si valeur t est de 2.25, peut rejeter l’hypothèse nulle.
🎂Test de moyennes / test t : 2 tests de moyenne paramétriques : 1.test t pour échantillons indépendants, 2. Test t pour échantillons appariés (paired-samples) - Test non-paramétrique : Test du U de Maan-Whitney.
🎂Test t pour échantillons indépendants. - Conditions nécessaires : VI = dichotomique. VD = quanti (intervalle/continue) - Postulats : 1. Distribution normale de la variable dépendante (moins problématique si n>50), 2. Min de 15-30 cas par groupes, 3. Homogénéité de la variance des groupes (homoscédasticités) : test de Levene.
🎂Homogénéité de la variance : - Levene non significatif = 2 groupes apparement différents, avec des variances similaires. - Levene Significatif : Deux groupes apparemment différents mais avec des variances significativement différentes.
🎂Application pratique : (dans pwp)
1. Mentionnez hypothèse pour l’analyse (non directionnelle, puis directionnelle)
2. Effectuez le test statistiques (respecte postulats / conditions). - Si p<0.05 test de Levene significatif : la variance est hétérogène :(. P> 0.05 test non-significatif donc homogène.
3. Rejet ou non-rejet de H0
4. Si rejet (p<0.05) : Précisez le sens de la relation / différences de groupes, Précisez la force de la relation. - Permet de comprendre / interpréter les différences de groupes existantes. (Moyenne et écart-type)
- L’Êta carré indique la force de la relation. Si 0.14, forte. 0.06 modéré. 0.01 faible. Êta carré représente le pourcentage de la variance de la VD qui est expliqué par la VI.
5. Présentation et interprétation des résultats des études antérieurs)
🎁Quelques pistes d’interprétation : En adéquation avec hypothèse directionnelle - Est-ce un résultat surprenant selon recherches existantes ou du sens commun?
- Si résultats de l’étude = différents de veux des études antérieurs = pourquoi? Échantillons ? Opération aliénation ?
- Qu’est-ce ce que ce résultat implique pour futures recherches ?
- Il faut mentionner et discuter des résultats, même s’ils sont non-significatif, en cherchant à comprendre pourquoi.
Cours 12 - Corrélation r de Pearson
🎁Corrélation (R de Pearson) : Mesurer l’association entre 2 variable quantitatives.
- Étapes nécessaire avant de faire une analyse multivariée. (Utilisé aussi pour mesurer asso entre variable indépendant à l’étude = colinéarité.)
- Ex hypothèse recherche : h1 : il existe une association entre l’âge à la 1er culpabilité officielle et revenu légitime mensuel. Plus l’âge à la culpabilité est tardif, plus revenu légitime mensuel déclaré sera élevé.
🍬Utiliasation : 2 variable quanti.
- Postulats d’utilisation : 1. Distribution normal des 2 variables quanti, 2. Absence de valeur extrême problématique, 3. Linéarité de relation, 4. Min. De 30 effectif/cas par variable.
🍬Postulats - Normalité et valeur extrême :
- 1. Normalité : Inspection des donnée univariées (asymétrie, aplatissement) et des histogrammes.
- 2. Valeurs extrêmes : Peut exagérer ou minimiser l’association entre 2 variable. Utiliser le test de corélation non paramétrique, si problématique OU éliminer les quelques valeurs extrêmes.
- 3. Linéarité : Observé à l’aide du diagramme de dispersion. Présente graphiquement l’ensemble des pairs des valeurs des 2 variables.
- Recours à corrélation non-paramétrique si : Problème évident quant à la non-linératié, On suspecte une relation non-linéaire au niveau théorique.
- Corrélation : Postulats, linéarité. (+ de participant sont regroupés ensemble, + chance relation significative et forte)
- Si respecte, Négative (haut vers bas), Positive (bas vers haut), absence de relation.
- Si non-respect, curvilinéraire (cloche a l’envers), Exponentielle (bas pis monte full vite ou inverse), Iogarithimique (Monte vite pis reste haut)
- 4. Nombre minimal de 30 cas par variable (se vérifie dans matrice de corrélation, via n de l’échantillon. Points de comparaison suffisants)
- Calcul basé sur somme des écarts à la moyenne pour valeurs variable x et y.
🎁Si non-respect au moins un postulat = test de corrélation non paramétrique.
- rho de spearman : rang plutôt que valeurs, permet détecter l’existence et sens d’une relation peu importe sa forme.
🎁Étapes : 1. Mentionner hypothèse (non-direct et direct.) Asso positiv ou négatif. PAS différence de groupes.
2. Vérification respect postulat, valeurs extrême.
- Linéarité : faire diagramme de dispersion.
3. Réaliser test de corrélation. Corrélation, significatif et l n. DDL = n -2.
- Matrice de corrélation, s’assurer que trois variable sont différentes de l’indépendante, sinon interdépendante.
4. Relation significatif : regarder le tableau si significatif.
5. Vérifier le sens et force de la relation (si applicable). - Coefficient de corrélation (r Pearson ou rho spearman).
- Indique la force et sens de la relation (Varie de -1 à 1)
- 0 à 0.2 : faible. 0.2 à 0.5 modéré, 0.5 à 0.8 forte, + 0.8 très forte, problème colinéarité.
6. Présentation et interprétation des résultats.
🍬Présentation habituelle dans articles scientifique : matrice de corrélation. (Tableau p.7)
Cours 13 - Régression multiple
🎁Introduction sur la régression simple
- Permet présenter graphiquement relation entre variables par une droite
- Permet de faire des prédictions : droite / équation linéaire.
- Permet de connaître la force explicative de VI et VD : coefficient de détermination.
🎁Régression simple - droite de régression
- Se résume par l’équation ( y=a + b(x) +e)
- Ou : Y = La valeur prédite par variable dépendante,
X = (prédicateur) valeur de variable indépendante
A = intersection / constante (valeur moyenne de Y lorsque X=0)
B = la pente (changement de Y associé au changement d’une unité de X, informe sur degré d la pente)
E=2.718 résidus; terme d’erreur
🎁Régression multiple :
- Phénomène = rarement expliqué par une seule variable /prédicateur
- Qu’en est-il de l’effet combiné de plusieurs variables ? Effet de variable tierce ?
🎁Régression linéaire multiple : - Améliore prédiction de la variable dépendante en prenant en considération l’effet de PLUSIEURS variables indépendantes.
- Permet de connaître leur effet unique ET leur effet combiné (VD)
- Permet d’inclure variables controle / tierce
- Présence de relation dite artificielle ?
- Modèle de prédiction (y=a +b1(x1)+b3(x3)+b4(x4+..+e)
🎁Type de régression : Différents type de régression selon l’échelle / le format de la VD.
- Des postulats d’utilisation s’applique pour chacun
- Variable dépendante : (- Quanti distribué normal, - Dichoto, - Catégorielle 3gr ou +) ! Type d’analyse régression : (- Analyse régression linéaire multiple, - Analyse régression logistique, - Analyse de régression logistique multinomiale.
🎁Régression linéaire multiple :
- Critère d’utilisation : variable D quanti, variable indépendante quanti ou dichoto
- Postulats : - Minimum 20 cas par variable, - Normalité distribution variable quanti (VI et VD), - Linéarité relation envers variables quanti, - Absence de colinéarité et mutlicolinéarité (indépendance VI entre elles)
🎁Régression linéaire multiple : postulats - comment ? :
- Min 20 cas par variable : nombre variable incluse dans modèle,
- Normalité distribution VD et VI quanti : Analyse univariées et inspection histogramme
- Linéarité de relation entre VD et VI quanti : inspection avec diagramme dispersion.
- Absence de corrélation et multicolinéralité = indépendance des observations
- Colinéraité = matrice de corrélation
- Multicolinéarité = indice de tolérance
(Aucune variable inutile incluse dans modèle)
- Suite aux analyses bivariées, inclure juste elle significative.
🎁Colinéarité matrice de corrélation (p.3)
- Valeur : 0 à 0.2 = faible. 0.2 à 0.5 = modéré. 0.5 à 0.8 = forte. + 0.8 = possible peut-être colinéarité.
🎁Multicolinérai : Modèle de régression + puissant quand chaque VI est fortement associé à la VD, mais que chaque VI est indépendante des autres VI.
- Lorsque 2 VI partage le même % variance expliqué de la VD = contribution PAS unique.
- Indice de tolérance = varie 0 à 1. Problème si plus petit que 0.30.
🎁Hypothèse : testons ici pour signification d’un modèle et non pour signification entre une VI et VD de façon particulière.
- Ex H1 : Modèle mesurant l’implication dans un mode de vie criminel permet de prédire le revenu criminel mensuel.
1. Vérifier respect postulats d’utilisation : Continue ou dicho, vérifier normalité, linéaire, matrice de corrélation.
2. Réaliser régression linéaire multiple. Vérification indice tolérance, Minimum effectifs par variable respecté.
3. Vérifier si modèle significatif = effet combiné des VI sur VD. Vérifier la force du modèle, cas échéant.
4. Vérifier seuil de signification et l’effet unique de chacun de vos VI. Parmi celles-ci significatifs: - Vérifier sens relation, - force, - quels sont les meilleurs prédicateur ?
5. Présenter et inerpréter les résultats.
(Le reste du ppw c’est un exemple)