Cours 6 à 12 Flashcards
En méthode quantitative, 3 méthode de collecte de données
- Données officielles
- Sondages de victimisation (trouver des victimes, pas le nombre de crimes)
- Données auto-révélées
Avantages et inconvénients de la méthodes de collecte de données quantitatives
Avantages:
- Quantité d’informations (très grande)
- Plusieurs hypothèses (peut en tester plrs)
-Rapide (questions avec choix faciles)
- Comparable (tous on les mêmes questions)
- Coût
Inconvénients:
- Déformation des propos (interprétation différente des questions)
- Inaptitude à répondre (répondre au hasard)
- Informations sommaires (pas possible d’investiguer les réponses et les adapter d’une personne à une autre)
- Chiffre noir
Exemple du chiffre noir en criminologie
Si les délinquants ne sont pas arrêtés, ils ne seront pas dans les chiffres, même si ce sont des criminels
Chiffre noir
Qu’est-ce qui affecte la reportabilité
Plus le délit est grave, moins il va être reporté (ex: vol = 62% et AS = 9%)
- Nature du crime
- gravité des délits
- proximité relationnelle
3 niveau du chiffre noir, de officiellement reporté à inconnu
- données officielles
- données de victimisation
- données auto-révélées
2 types de données officielles et description
Données unitaires: vise une personne en particulier, pourrait avoir le nom du participant
Données agrégées: regroupé en quartier, groupes sociaux… anonyme
Avantages et inconvénient des données officielles
Avantages:
- Coût
- Accès
- Études extensives et évolutives
- Standardisation (facilement comparable entre les pays)
Inconvénients:
- Chiffre noir
- Problème d’incidence (peu avoir commis plus d’un délits, commettre 2 meutres sur les 4 recenssés)
- Problème de classement (délit officiel n’est pas toujours le délit réel)
- Utilité limitée pour … (macro: canada, micro: individuel)
But des sondages de victimisation
ESG: Enquête sociale générale
Q : est-ce que les personnes ont été victimes d’un crime au cours d’une période donnée?
Demander un recenssement des victimes pour réduire le chiffre noir en recessant ceux qui n’ont pas été reportés
Avantages et inconvénient sondages de victimisation
Avantages:
- Chiffre noir
- Ne dépendent pas du SJP (syst. justice pénal)
- Caractéristiques des victimes
- Conséquences de la victimisation
Inconvénient:
- Informations partielles (pas d’info sur le criminel)
- Certains types de délits pas abordés (ne prend pas en compte les crimes sans victimes)
- Localisation temporelle (quand le crime a été fait)
- Interprétations personnelles
- Comparaison difficile (entre les pays et les personnes)
Comment sont récupérées les données auto-révélées
Questionnaires standardisés, qui sont des test de personalités et validé empiriquement
Avantages et inconvénients des données auto-révélées
Avatages:
- Chiffre noir
- Facteurs de risque et de protection (faire des lien ex: impulsivité et criminalité)
- Très grands échantillons
- Analyse indépendante du SJP (ne sont pas dans les données officiellles)
- Méthode valide (questionnaire standardisé)
- Coût
- Anonymat (cherche la tendance et non des personnes en particuliers
Inconvénents:
- Pas la population fortement criminalisée
- Intrusion du chercheur (lui qui choisi les questions et les thème, impose son choix de questions)
- Attention aux mauvaises formulations (variation des interprétations)
- Ne prend pas en compte la complexité (ne pas venir chercher en profondeur les réponses)
- Amplification ou minimisation
- Localiser dans le temps
- Interprétations personnelles
4 types de méthode de collecte de données qualitative
- observations
- entrevues
- analyse documentaire
- groupe de discussion (focus group) - entrevue en groupe sur un sujet/thématique
Concept, dimension, but
Concept: représentation mentale, générale et abstraite d’un ou de plusieurs phénomènes
Lorsqu’il est trop large, il faut le diviser en dimensions
Capacité de le mesurer
**But **: faire preuve de parcimonie (simplification) tout en optimisant notre capacité à expliquer ce que l’on veut expliquer
Ex: Concept = psychopathie
DImensions = détachement émo, antisocial, manipulation
définir Définition conceptuelle et exemple
Lorsque l’on a réussi à identifier notre concept et ses dimensions (et sous-dimensions), on peut alors créer une définition conceptuelle
Définir tous les aspects autour desquels s’articulent le concept
Ex: prolème d’argent (concept), arrive quand il y a plusieurs dettes et peu de revenu (dimensions)
Comment élaborer sa définition conceptuelle
Commencer avec sa propre définition (intuition, expériences, observations, etc.)
On précise en faisant une recension des écrits : comment le concept est-il défini par les autres ?
Qualités d’une bonne définition conceptuelle (4)
- clarté
- précision
- concision
- exactitude
Risques liés à une mauvaise conceptualisation :
Biais dans les résultats
Influence sur la pratique
Influence sur l’opérationnalisation (mal mesuré)
ex: les incels veulent un relation, mais en n’ont pas. Trop de gens peuvent entrer dans cette catégorie, mais ne sont pas tous misogyne. Le terme incel est donc mal défini ce qui peut apporter un biais dans les résultats et en apporter de mauvais.
Opérationnalisation et son but
façon dont on organise et mesure nos concepts/variables pour passer de l’abstrait au concret. Pour convertir une idée en une mesure.
Comment le concept et ses dimensions peuvent-ils s’observer dans la réalité?
Obj:
Écrire des questions qui se retrouveraient dans un sondage
Définir des énoncés précis qui pourraient être intégrés dans un instrument de mesure
L’opérationnalisation joue un grand rôle dans la validité de l’instrument parce qu’on réfère à l’exactitude de la mesure afin d’évaluer un concept
Conceptualisation à l’opérationnalisation (en ordre)
- Cencept latent (Nommer les multiples sens associés au concept)
- Dimension (Dégager les dimensions pertinentes)
- indicateurs (Définir les indicateurs (les questions à poser)) – opérationnalisation
Ex: psychopathie – charme, manipulation – Question PCL-R
Définition conceptuelle vs définition opérationnlle
Conceptuelle: fait référence à la signification abstraite et théorique d’un concept (ex: définition textuelle)
opérationnelle: fait référence à la manière dont les variables sont mesurées ou à l’instrument utilisé (ex: questions PCL-R)
3 types d’indicateurs et exemples
Les comportements
ex: Actions des participants, formes de crimes
Les opinions, les intentions, les attitudes
ex: Idées sur un sujet, perceptions
Les conditions objectives d’existence
ex: Genre, salaire, âge, caractéristiques d’un quartier
définition d’une variable
indicateur qui varie et auquel des **valeurs sont assignées **
Une variable peut indiquer des degrés, des quantités, des différences
Précise de quelles façons les indicateurs seront codifiés
Les indicateurs deviennent alors des variables
Comment peut-on utiliser les statistiques et pourquoi sont-elles utiles
La statistique est un langage avec ses règles, ses termes et ses expressions (sont un outil)
elles permettent de répondre à des questions de recherches
permet de rendre le monde clair et compréhensible
Objectifs des statistiques
Objectifs :
Répondre le moins imparfaitement possible
Repérer les réponses les plus imparfaites
Les données que l’on veut mesurer vont être mesuré de manière imparfaie. On essaie de se rapprocher de la vrai mesure, mais c’est impossible de l’Atteindre. Les statistiques vont nous permettre de répondre un peu moins imparfaitement
Comment trouver une bonne variable
indicateur auquel des valeurs sont assignées
Degrés, quantités, différences, etc.
Précise de quelle façon les indicateurs seront codifiés
Les indicateurs deviennent alors des variables
Une variable n’est pas nécessairement la réponse à une question d’un questionnaire. Elle peut aussi être un calcul
Exemple : le ratio mensuel du nombre de voies de faits commis à Montréal / 100 000 habitants
Noms des 3 types de variables (sans décire)
Nominale / catégorielle
Ordinale
Continue (intervalle ou ratio)
Description d’une variable nominale
Séparé en catégories
plusieurs possible (dichotomique ou polytomique)
Il n’y a pas de valeur qui a plus d’importance qu’une autre
PAS d’opérations mathématiques, sauf si c’est pour une analyse descriptive (ex: fréquences)
Qu’est-ce qu’une variable ordinale
Échelle qui va impliquer un rang (un peu, moyen, bcp, énormément)
Certaines valeurs vont avoir plus de force que d’autres
La distance entre chacune des valuers n’est pas toujours égale (dépend de l’imterprétation)
Qu’est-ce qu’une variable continue
Peut les mettre en ordre avec des chiffres et la distance entre chaque valeurs est égale (valeurs réelles)
Intervalle: n’a pas de 0 absolu où le 0 ne signifie PAS l’absence du phénomène (ex: température)
Ratio: 0 signifie une absence du phénomène (ex: nombre de crime)
Exemple d’une variable qui change de forme
Quel âge avez-vous? (variable continue)
À quelle catégorie d’âge entre jeune et âgé (variable nominale)
Quel âge entre 0-5, 6-10, 11-15, etc… (Variable ordinale)
Qu’est-ce que l’analyse univariées
relative à une variable : distributions de fréquences
une seule variable est regardé = analyse descriptive
À quoi sert les tableaux de fréquences
- Prendre connaissance des données (donner une première idée)
- Voir la distribution des variables à travers l’échantillon
- Détecter les problèmes :
–Valeurs manquantes (pas répondu)
–Données aberrantes (répondu n’importe quoi)
–Catégories devant être retravaillées - Évaluer les possibilités d’analyse
Buts de l’analyse univarié
- Étape préliminaire
- Idée générale de la nature des variables
- Orienter les analyses subséquentes
- Lorsqu’on a un problème, la solution se trouve souvent lors de l’étape des analyses descriptives… (va permettre de savoir quel est le type d’une variable)
3 aspects de l’analyse univariée
- mesure de tendance centrale
- mesures de dispersion
- distribution des résultats (variables continues)
Qu’est-ce que contient les mesures de tendance centrale et à quoi ça sert
Utilité:
- Indiquent où se trouve la majeure partie des données
- Score typique (moyenne de groupe)
- Effort de synthèse
Contient:
- mode
- médiane
- moyenne
Mesures de tendance centrale
Mode
Valeur la plus fréquente d’un ensemble de données
Pour variables NOMINALES, ORDINALES et CONTINUES
Rarement employé seul
Mesures de tendance centrale
Médiane
Observation du milieu
2 3 3 4 4 4 4 4 4 5 5
Pour variable ORDINALE et CONTINUE
Mesures de tendance centrale
Moyenne
Mesure de tendance centrale la plus courante
où X est une valeur numérique réelle
Pour variable CONTINUE seulement
Mesures de dispersion
Pourquoi avons-nous besoin de mesures de dispersion et qu’elles sont les 3 utilisées
Les mesures de tendance centrale ne suffisent pas
Étalement des valeurs autour d’une valeur centrale
Étendue
Variance
Écart-type
Mesures de dispersion
Comment mesurer l’étendue
Max - min = étendue
Mesures de dispersion
But de la variance et comment la mesurer
Dispersion de chaque observation autour de la moyenne
(Somme(Chaque valeur – la moyenne)^2)/(n-1)
(éviter les conflits entre valeurs négatives et positives)
petite variance, donc plus près de a moyenne
Comment mesurer l’écart-type et son interprétation
Racine carrée de la variance.
68,2% des résultats sont compris entre -1 et +1 ET
95,4% des résultats sont compris entre -2 et +2 ET
99,6% des résultats sont compris entre -3 et +3 ET
Un grand écart-type va avoir des données étalées
La moyenne est ligne centrale qui sépare en 2
Qu’est-ce que la loi normale
Moyenne, médiane et mode sont au même point et les données sont également réparties de chaque côté de la normale.
Pour variable CONTINUES
NORMALE et ORDINALE vont utiliser des histogrammes
Kurtose des distribution (3)
Indice d’aplatissement, étalement par rapport à la moyenne (tous par rapport à la loi normale (distribution normale))
- Distribution leptocurtique (haute et mince)
- Distribution normale
- Distribution platicurtique (basse et large)
Symétrie des distributions
indice de symétrie
Right skewed / asymétrie positive : La majorité des données à gauche, diminue à droite
Left skewed / asymétrie négative : la majorité des données sont à droite, diminue à gauche
Qu’est-ce que la valeur latente et comment on la mesure
Va être mesuré avec des indicateurs (valeurs observables)
Valeur observable=valeur latente+erreur
Comment diminuer l’erreur associé à la mesure
construction d’une échelle de mesure composite
- On regroupe plusieurs indicateurs (questions)
- On obtient ainsi une variance plus juste et réelle
Problèmes de variance d’une mesure (3)
Peu d’observations pour mesurer un phénomène
Peu de choix de réponse (dichotomique vs continue)
Tout le monde répond la même chose (ex : sadisme) (ne permet pas une bonne diversité de score)
C’est quoi mesurer la fidélité et la validité + erreur de mesure
Mesurer : opération qui consiste à assigner des nombres à des objets, à des événements ou à des situations selon certaines règles.
Passer du construit théorique à une expression quantifiable / mesurable
Erreur de mesure : différence entre la mesure réelle (score vrai) et celle qui est prise à l’aide d’un instrument de mesure (score observé)
C’Est quoi un instrument de psychométrie et son objectf
Instrument psychométrique :
Outil développé scientifiquement qui permet de mesurer un concept latent de manière objective et standardisée
Peut prendre plusieurs formes
Objectif : la mesure la moins imparfaite possible, diminuer au maximum l’erreur
Trois critères pour qualifier un outil psychométrique
- Standardisation : uniformité de la démarche d’administration et de correction des réponses
- Objectivité : les résultats obtenus ne résultent pas d’une évaluation subjective
- Propriétés psychométriques : fidélité et validité
Pq important de respecter la fidélité et la validité (2)
Respecter la fidélité et la validité permet de se fier aux données recueillies et de tirer des conclusions plausibles à partir des résultats obtenus
Les professionnels prennent des décisions importantes et analysent des situations délicates
Exemple : relâcher un criminel dangereux
Définition de la fidélité et de la validité
Fidélité : précision et stabilité de la mesure
Ce que nous mesurons est-il mesuré sans erreur ? quelle est la précision de la mesure ? quelle est la constance de la mesure ? Résultats constants
Validité : **représentativité **de la mesure
définition de stabilité temporelle et technique
Stabilité temporelle : constance sur le plan temporel des mesures répétées prises auprès d’un même groupe de participants
Technique :
Test et re-test avec un délai de 2 à 4 semaines entre les deux passations
Coefficient de corrélation (r) entre les résultats obtenus aux deux passations (0,7 et 0,9)
Équivalence – formes parallèles
et technique
: fidélité entre deux versions équivalentes d’un instrument de mesure
Technique :
Coefficient de corrélation entre les 2 versions d’un même instrument de mesure (0,7 et 0,8)
Équivalence – accord inter-juges
et technique et corrélation
degré auquel deux observateurs (ou plus) obtiennent les **mêmes résultats **sur le même événement observé
Technique :
Pourcentage de concordance entre les observateurs
Sujets classés dans les mêmes catégories (kappa > 80% suffisant)
Corrélation entre les résultats fournis pour chaque énoncé
Corrélation intraclasse > 75% suffisant
Cohérence ou consistance interne
et technique et fidélité
degré d’homogénéité des énoncés d’un instrument de mesure. C’est le lien de chaque énoncé avec le total de l’échelle
Technique :
Coefficient alpha de Cronbach
Bonne fidélité :
- Alpha de Cronbach > 0,70 est une bonne consistance interne
- Les indicateurs corrélés négativement ou qui font baisse l’alpha sous 0,70 sont retirés de l’échelle
Nommez les 3 types de validité et les sous-types
Validité de contenu
Validité de construit
Validité convergente
Validité discriminante
Validité de critère
Validité concomitante
Validité prédictive
Validité de contenu, technique et bonne validité
Validité de contenu : indique que les énoncés qui déterminent le contenu sont représentatifs du ou des construits mesurés et de leurs différentes facettes (dimensions)
Technique : décision subjective (réévaluation périodiquement), pas de test précis pour évaluer la validité de contenu. Elle s’évalue par une accumulation d’évidences, on s’appuie sur la littérature –> conceptualisation
Bonne validité :
Les items doivent couvrir tous les aspects principaux du concept mesuré
Les items doivent** couvrir** ces différents aspects de manière proportionnelle
L’instrument ne doit pas contenir d’items non-pertinents
estimation de la représentativité d’une mesure pour chaque élément d’une mise en situation
Validité de construit - convergente, technique
Validité de construit – validité convergente : indique que 2 mesures censées refléter le même construit produiront des résultats similaires
Technique : Coefficient de corrélation (r)
Cependant la validité convergente, ne suffit pas, il faut vérifier la validité discriminante.
validité de construit - discriminante, technique et validité
Validité de construit – validité discriminante : Désigne la capacité de l’instrument à établir une distinction entre des groupes dont la différence est connue
Technique : Test de comparaison de moyennes
Bonne validité :
Test significatif
Besoin d’une bonne validité convergente et discriminante, sinon ne peut pas être utilisé
validité de critère - concomitante, technique
Validité de critère – validité concomitante : Établit la validité d’un nouvel instrument de mesure pris simultanément avec une mesure reconnue comme valide (mesure avec test référentiel) bon si haute correlation
Technique :
Coefficient de corrélation entre deux instruments de mesure représentant un même concept (à un seul temps de mesure)
validité de critère - prédictive, tecnique
Validité de critère – validité prédictive : Détermine si le résultat actuel, obtenu à l’aide d’un instrument, peut être utilisé pour prédire un résultat ultérieur
Technique :
Coefficient de corrélation entre une mesure d’un concept au temps 1 et au temps 2 (période plus grande que le test-retest), ou entre la mesure d’un concept et un autre qui lui est intimement lié.
Prédiction des aptitudes
validité de critère - prédictive
évaluation rétrospective vs prospective
Évaluation rétrospective : Le comportement que l’on veut prédire est déjà connu (ex. : le délinquant en libération conditionnelle a-t-il récidivé oui ou non?)
On remplit l’instrument d’évaluation pour voir si les résultats concordent avec le comportement déjà observé
Évaluation prospective : Le comportement qu’on veut prédire n’est pas connu (ex. : le délinquant en libération conditionnelle récidivera-t-il oui ou non?)
**Faire passer **l’instrument dans un 1er temps. Après un certain temps, évaluer si nos prédictions étaient bonnes (mesure réelle de la récidive)
comment vérifier la validité
Validité = acquisition de connaissances + compréhension de la nature du phénomène
3 éléments de la triangulation
Plusieurs sources de données
Plusieurs méthodes de collecte de données
Plusieurs méthodes d’analyse de données
objectif de la création d’échelle
concevoir des échelles qui mesurent mieux nos concepts que des variables seules
limiter l’erreur de mesure et donc une façon de le faire est de construire des échelles
l’alpha de Cronbach permet de vérifier la qualité des échelles.
description de l’alpha de cronbach (définition et ce que ça fait)
mesure de la consistance interne d’un ensemble d’items formant une mesure
présuppose que les mesures du phénomène vont toutes dans le même sens
permet de vérifier que les questions (indicateurs) que l’on a rassemblées permettent effectivement de mesurer des choses similaires.
Alpha de Cronbach
Comment l’alpha peut être utilisé (3)
Comment savoir si la mesure est bonne
Utilisation : variables continues de type intervalle ou ratio ; échelles ordinales
Attention : toutes les variables contenues dans l’échelle doivent être de même nature !
On retient les items qui sont une forte corrélation avec le total
Améliore la consistance interne
L’alpha est une mesure qui est influencée par le nombre d’items
entre 0 et 1, 1 étant sus
comment chaque question corrèle avec le score total de l’échelle. C’est ce qui va nous donner une indication sur quelles questions sont les plus pertinentes pour mesurer le concept total. (SPSS)
Dans la colonne ‘‘Alpha if item is deleted’’ et si l’alpha obtenu est 0.75, comment décidera-t-on de supprimer un item
Si on voit que l’alpha obtenu est le plus élevé on reste comme ça (rien n’est plus haut que 0,75 si un item est retiré)
Si on voit que l’alpha serait meilleur en supprimant un item, on refait l’analyse en supprimant l’item pour vérifier (l’alapha de plus de 0,75 si l’item est retiré)
Aussi si ‘‘corrected item - total correlation’’ est négative = retirer l’item
Objectif est de garder un alphaC identique ou supérieur (qui se rapproche de 1)
Variable dichotomique
l’alphaC peut seulement être utilisé pour des valeurs ordinales et continues. Comment procéder pour des variables dichotomique
nom différent : le KR-20
Identifier les variables dichotomiques
Faire des fréquences pour s’assurer qu’elles sont bien dichotomiques
Calculer l’alpha de Cronbach mais on va l’appeler KR-20
Créer l’échelle en additionnant les variables avec SPSS
Ce qu’il faut s’assurer d’avoir pour faire des échelles
Identifier les concepts que l’on veut mesurer, les dimensions, les indicateurs
Est-ce que ces variables sont toutes du même type (continues, ordinales, dichotomiques) ?
Est-ce qu’elles varient toutes dans le même sens ?
Est-ce que les échelles (ordinales) sont similaires ? Si non, les rendre similaires (1 vaut faible pour tous, 5 vaut fort pour tous, tous avec la même unité de mesure (m, cm))
Alpha de Cronbach (ou KR-20 pour variables dichotomies) sur SPSS
- Éliminer les variables corrélées négativement (avant dernière colonne avec un - )
- Éliminer les variables qui font baisser l’alpha
Qu’est-ce qu’une analyse bivariée
2 variables (multivarié = +2)
Nominale, ordinale, continue
exemples
Pourquoi consommation de drogues et crime violent ne sont pas suffisant comme variable
Consommation de drogue et crime violent ne peuvent pas être catégorisé comme nominale, continue, ordinale pour savoir comment les mesurer
ex: Consommé et non consommé (nominale, dichotomique), Quelle drogue (nominale, polytomique), quel niveau
Quelle crime (nominale), degré de violence (ordinale)
Conséquence de postulats non respectés
conclusions peu valides
3 étapes de l’analyse des résultats
La signification : Existe-t-il une relation statistiquement significative entre les deux variables ?
La **force **de la relation : Ce lien est-il important ?
Le sens de la relation : Que veut dire ce lien en termes concrets?
SIGNIFICATION
Comment mesurer si la relation observée attribuable à la chance?
p-value
moins de 0.05 (5%) = seuil de tolérance
Si dûe au hasard, changer de type d’analyse
Signification: est-ce que c’est statistiquement significatif / relation réelle entre les deux, ou hasard
SIGNIFICATION
à quoi sert le seuil de tolérance ‘‘p’’
Seuil minimal
Probabilité de se tromper en affirmant qu’il existe un lien entre les variables.
Rejet de H0 (hypothèse nulle)
Indique qu’il existe un lien/ une différence significative entre les variables
Dépend du nombre de participants
p ≤ 0,05 : nous avons moins de 5 chances sur 100 de nous tromper en affirmant qu’il existe une relation significative
Si peu de participant, besoin de grande différence pour que ça paraisse
FORCE
qu’est ce qui établit si la différence est attribuable à la taille de l’échantillon ou non.
la force de la relation
près de 1 = fort
criminologie = max 0.8
FORCE
Ce qui est important à savoir pour la force
Différent pour** chaque test** statistique
Dépend du domaine d’étude
Coefficient de plus de 0,80 indique la colinéarité (risque de mesurer la même chose = près de 1)
SENS
qu’Est-ce qui permet la transcription en mots concrets de la relation entre les variables
Sens de la relation
Si significativité est forte, permet de savoir la relation entre les 2 variables, mais besoin d’une analyse du sens des relations
À quoi sert les tableaux de contingence
Permet de facilement regrouper des information
Tester le lien de dépendance/indép entre 2 variables catégorielle/nominale
Postulats d’utilisation pour les tableaux de contingence
Échantillon aléatoire (dans le cours, prendre pour quis que c’est aléatoire)
Les nombres ne doivent pas être trop petits :
Le total ne doit pas être plus petit que 20
La fréquence dans chaque case ne doit pas être inférieure à 5
indicateur pour les 3 questions (signification, force, sens)
signification : khi2
force : Phi ou V de Cramer
sens : comparaiseon de % dans un tableau
tableau de contingence
À vérifier pour ‘‘signification’’
Rappel : deux variables catégorielles/nominale
Le nom de la statistique utilisée : X2 / Chi carré
Si chi2 est p<0.05 = relation significative
tableau de contingence
À vérifier pour ‘‘force’’
On ne peut pas déduire la force à partir de la significativité
Phi pour 2 x 2
V de Cramer pour k x k
tableau de contingence
À vérifier pour ‘‘sens’’
Tableau 2 x 2 : On regarde les pourcentages indiqués dans le tableau
**Tableau k x k **: Plus difficile à interpréter
Plus d’analyses sont nécessaires :
Création de variables muettes (dummy variables)
Variables dichotomiques
Autant de variables muettes que de catégories
Transformer le kxk en 2x2, Faire un chi2 à l’aide
d’un tableau 2x2
Comment rapporter les résultats en examen
Question de recherche : Existe-t-il une relation entre le statut de minorité visible du meurtrier et le sexe de la victime?
Réponse : Il existe une relation statistiquement significative entre le statut de minorité visible du meurtrier et le sexe de sa victime (Chi2 = 10,46 ; p = 0,001). Cette relation peut être considérée comme faible (Phi = 0,17).
Les meurtriers appartenant à une minorité visible ont tué des hommes dans 75,8% des cas (n = 179), cette proportion étant statistiquement supérieure aux meurtriers n’appartenant pas à une minorité visible (59,5% ; n = 75).
ou
Les meurtriers appartenant à une minorité visible ont tué des femmes dans 24,2% des cas (n = 57), cette proportion étant statistiquement inférieure aux meurtriers n’appartenant pas à une minorité visible (40,5% ; n = 51).
À quoi sert les tests de moyennes
Principe des tests de moyennes est de comparer des distributions pour voir si la différence entre les distributions est significative
Quelle famille de test va être utilisé pour une variable catégorielle ET une variable continue
Nommez ses postulats (3)
famille des test de moyennes
- Échantillon aléatoires indépendant
- Distribution de la variable continue est normale
- n>30
- les variances sont comparables/homogènes (Test de Levene NON-SIGNIFICATIF
p > 0.05 –> variance est similaire (dos de chameau)
variance meh si p>0.05 et p<0,1 (une des bosses près de la moyenne)
Idée test de moyenne est d’avoir plusieurs groupe et voir à quel point se distinguent avec un test continus
pour les test de moyennes, si les 3 potulats sont respectés, quel est le test à faire selon le nombre de groupes
2 groupes = T de student
+2 groupes = Oneway Anova
Dans les statistiques bivariés, qu’est-ce qu’il faut faire pour deux variables catégorielles
postulats?
pas de postulats
tableaux de contingence
Dans les statistiques bivariés, qu’est-ce qu’il faut faire pour deux variables continues
postulats?
Famille de correlations
- variables continues
- absence de valeur(s) extrême(s)
- distribution normales
- linéarité de la relation
Pour les tests de la famille des corrélation, quel test pour « oui » aux 4 postulats et « non » pour 1 des postulats
4/4 = test paramétrique - R de Pearson
3/4 et - = test non paramétrique - Rho de Spearman
Caratéristiques du test de T
2 caratéristiques, principe, objectif
Variable catégorielle ET continue
compare 2 groupes
Principe: rapport de différence des moyennes sur l’erreur standard
Objectif: déterminer si les 2 moyennes sont égales ou non
Si moyennes similaires = non significatif
Si moyennes différentes = significatif, donc lien statistiquement significatif
Les 3 questions à se poser pour le test t
Signification: Existe-t-il un lien (statistiquement significatif) entre mes variables ? - P associé au coefficient t (p < 0.05)
Force : Ce lien est-il important ? - Valeur de l’Eta2 (force des tests de moyennes paramétriques) Entre 0 et 1
Sens : Que veut dire ce lien concrètement ? (comparez les moyennes) - Comparaison de moyennes dans un tableau
FORCE: Son interprétation va dépendre du domaine étudié et du type de domaine d’étude
TEST t
Quoi vérifier dans les tableaux
- Valeu de N (>30)
- Test Levene : SIG (>0.05 = good)
- t-test: SIG 2 tailed (<0.05 = good)
- Comparer les moyennes avec le tableau où il y avait N (SPSS : utiliser pour Eta2)
Objectif de one way anova et potulats
Objectif : comparer les moyennes de trois groupes ou plus
Mêmes postulats d’utilisation que le test T !
Oneway anova
Comment savoir si test F non significatif
Si p>0.05 (trois bosses à la même place ou presque)
Significatif même si 2 bosses sont à la même place tant qu’une est mis à part
Oneway Anova
objectifs des post hoc, leur nom et quand utilise
Objectif des post hoc : comparer les sous-groupes en tenant compte d’une correction mathématique de l’erreur
Scheffé : utilisé dans le cas de groupes de **tailles différente **
Tukey : Utilisé seulement quand les groupes sont de taille semblable
Qu’est-ce que l’analyse de corrélation et son type de variable
comparer deux distributions pour savoir si la différence perçue entre celles-ci est significative ou si elle est due au hasard
2 variables continues
Test de corrélation
Comment quantifier le lien entre les 2 variables continues
Distance de chacun des points avec la droite hypothétique
Test de corrélation
Comment savoir si observations sont indépendante
les 2 variables ne doivent pas mesurer la même chose ou une partie de la même chose (ex: examen final et note intra)
Quoi reagarder pour savoir si graphique d’une distribution normale
ressemble courbe normale (une variable sur axe des x et nombre de participant sur axe des y)
Quoi reagarder pour savoir si graphique d’une relation linéaire
axe des x et axe des y avec un variable sur les axes
3 questions à se poser pour test de R de pearson
Singification: P associé au coefficient de corrélation r de Pearson
Force: Valeur du r de Pearson petit = faible
Sens: Le signe (+ ou -) de la valeur r de Pearson entre -1 et 1 (-1 et 1 = l’un prédit l’autre parfaitement = rare)
Qu’Est-ce que le R^2
r^2 : proportion de variance expliquée (en %) (r x r) = Pourcentage qui correspond à la variabilité
Dans quelle mesure vi affecte vd, savoir si relation entre les variables
Ex: les placements antérieurs vont permettre de comprendre 56,3% de la variance dans le nb de crimes