examen 1 Flashcards
Quels sont les critères à respecter afin qu’un fait soit considéré comme scientifique ?
Observé empiriquement
obtenu grâce à méthodes appropriées
lien recherche-théorie
vérifié et reproduit
Caractéristiques de la recherche QUALItative
Profondeur
(pas généraliser)
approche phénoménologique (perceptions)
Entrevues jusqu’à saturation
Cas particuliers, différences
Caractéristiques recherche quanti
Recours à concepts théoriques
VD et VI
Tendances/généralisation
- de place à l’émergence de concepts
Expliquer l’approche mixte
quanti + quali
= données quanti auprès d’un large échantillon
puis volet descriptif auprès d’un sous-groupe du même échantillon
Forces des 2
Qu’est-ce que le raisonnement inductif ?
Spécifique au général
faits à la théorie
Quanti
On ne sait pas pkoi on observe un X phénomène, alors on se laisse guider par ce qu’on collige
- observation
- identification de patterns récurrents
- conclusions préliminaires
Étude exploratoire et descriptive
Qu’est-ce que le raisonnement déductif ?
du général au spécifiques
théorie aux observations empiriques
- formulation d’hypothèses
- observations pour vérifier hypo
- acceptation ou rejet de ces dernières
étude explicative et prédictive/évaluative
Expliquer variable dépendante (y) et indépendante (x).
X= celle que l’on manipule pour connaître l’effet que ça aura sur la variable dép. (Y)
Variables contrôles ou tierces
Peuvent jouer un rôle dans la relation observée entre les 2 variables (souvent variables sociodémographiques)
Nommer et expliquer les cinq buts de la recherche en criminologie
- Décrire : groupe de personnes, quartier, situation, dresser un portrait. Prévalence d’un phénomène
- Explorer (interchangeable avec 1): portrait général et facteurs associés + hypothèses (est-ce que X fonctionne ? Est-ce qu’on est capables d’utiliser X théorie pour comprendre Y phénomène sur le terrain ?)
- Classifier : quels sont les patterns/profils type ? Enjeu : on peut forcer des gens à entrer dans des boîtes qui ne leur vont pas nécessairement
- Expliquer (les relations) : pourquoi X est arrivé ? Déterminer causes (indép.) et effets (dép.) + préciser le sens des relations. S’appuie souvent sur théorie, modélisation
- Prédire et évaluer : qu’est-ce qui est efficace ? causes et effets d’u programme, d’une loi (objectifs atteints ?)
Plus on est loin dans les étapes, mieux le sujet est maîtrisé par la communauté scientifique.
Nommer les cinq phases de la recherche quanti.
CIRCULAIRE conceptuelle méthodologique empirique analytique diffusion
Expliquer la phase conceptuelle
Élaborer thème de recherche
Explorer sources et recension
Élaborer cadre de recherche (cadre conceptuel)
Déf. de la problématique : résumé de ce que la littérature nous a apprise jusqu’à maintenant, puis qu’est-ce qu’il reste à découvrir (combler les lacunes)
Élaborer but, objectifs de la question de recherche
Qu’est-ce que la question de recherche ?
Énoncé interrogatif (?) qui précise
a) l’objectif et les concepts à l’étude
b) la population cible ou l’unité d’analyse
c) permet de connaître l’angle et le niveau de la recherche (exploratoire, descriptive, etc.)
Découle de la recension des écrits (failles à combler)
Expliquer la phase méthodologique
-choisir une approche analytique
-Opérationnalisation (démarche qui permet de rendre mesurable les concepts/dimensions à l’étude, à capter la réalité des phénomènes)/ conceptualisation des concepts (processus par lequel on met en mots une idée abstraite : idée théorique transposée dans un langage opérationnel et précis)
-Choisir méthode/technique de recherche (élaborer instrument de collecte)
définir la pop.
-définir sorte et type d’échantillonage
Processus (expliquer) Conceptualisation + opérationnalisation
Conceptualisation: définir l’idée vers le concret (définir les concepts)
Opérationnalisation: (rendre mesurables les concepts et les dimensions) 3 étapes
a) Identification des indicateurs (qu’est-ce qui va nous permettre, sur le terrain de mesurer les différentes dimensions à l’étude)
b) création de variables ou indices (1 dimension peut avoir plusieurs variables)
c) identification/sélection des modalités (nominale/ordinale ?) de la variable
DONC : concept indépendant — dimension —- variable + échelle de la variable
—-variable + échelle de la variable
— dimension —- variable + échelle de la variable
Expliquer la phase empirique
cueillette de données et création de base de donnée
Expliquer la phase analytique
Nettoyage et préparation des données
Analyse (univariée, bivariée, multivariée, etc.) et interprétation des données
Analyse et présentation des résultats
Expliquer la phase de diffusion
présentation, publication et communication des résultats
Variable qualitative nominale
chacune des catégories est indép. de l’autre
sert à qualifier des personnes, objets, groupes
établir DIFFÉRENCES
pas d’ordre ou de hiérarchie ex.: type de drogue consommée
dichotomique : 2 choix de rép. ex. : sexe
variable qualitative ordinale
catégories ordonnées
relation d’ordre (pas du tout jusqu’à beaucoup)
catégories d’âges exemple
gravité du crime
Variable quantitative intervalle
permet d’évaluer les réponses de façon à ce que l’écart entre deux réponses ait une signification
Notion de distance + notion d’ordre
0 ne signifie pas absence de qqchose
ex. : température extérieure au moment du délit
Variable quantitative continue (de proportion, de rapport)
0 = absence de qqchose (zéro est imposs)
rapport entre deux variables est interprétable (10$ vs 20$ = double)
ex.: combien de crimes sexuels
quel âge
combien d’années de scolarité
Quels sont les deux critères à respecter en termes d’échelle de mesure d’une variable ?
Exclusivité: une personne ne peut se trouver dans 2 catégories
Exhaustivité: toutes les valeurs/modalités possibles de la variable sont présentes
Terminologie - différence entre valeur et modalité
- différentes quantités numériques possibles de la variable
- différentes réponses ou choix de réponse possibles de la variable
Quelle est l’utilité de l’analyse univariée ?
PAS EXPLIQUER
décrire et présenter les données
Quelles sont les mesures de tendance centrale ?
Mode Mo : valeur la plus fréquente dans la distribution (possible d’utiliser les 4 types de variables. Plus fréquent: NOMINALE) doit présenter une variable de bcp différente
Médiane Md : diviser une distribution donnée en 2 parties égales (variable intervalle, variable continue, VARIABLE ORDINALE), peu influencé par les variables extrêmes
Moyenne X : somme des données divisée par leur nb (variable INTERVALLE et CONTINUE), ne représente pas l’homogénéité ou l’hétérogénéité de la distribution
Détails en lien avec Md (médiane)
Données groupées/variable ordinale:
- Se fier au % cumulatif
- Identification du 50ième percentile (50%)
Variable continue
- Md= (n+1)/2
n= nb d’unités d’analyse
Expliquer et nommer les différentes mesures de position
Quantiles : valeurs qui partagent une distribution en un certain nombre de parties égales
Quartiles % 4
Déciles % 10
Centiles % 100
Quelles sont les mesures de dispersion
Étendue : renseigne sur l’étalement des données, différence valeur la plus élevée et valeur la moins élevée
Variance (S2): renseigne sur variabilité/homogénéité des données, mesure la distance de chaque observation par rapport à moyenne, sensible aux valeurs extrêmes, difficile à interpréter, ne pas utiliser avec unité, calcul compliqué
si élevé: hétérogénéité
si faible: homogénéité
Écart-type (S): renseigne sur variabilité/homogénéité des données, mesure la distance de chaque observation par rapport à la moyenne, sensible aux valeurs extrêmes, même métrique que la variance
S élevé: hétéro
S faible: homo
À quoi sert l’inspection des données ?
permet de nous familiariser avec les données en main
permet de vérifier la faisabilité/respect des critères de base
permet de déterminer le type d’analyse statistique adéquat
- Variable quali: observation et déclaration de valeurs manquantes, inspection de la répartition des effectifs parmi les différentes catégories
- Variable quanti: inspection de la normalité de la distribution, gestion des valeurs extrêmes si nécessaire
Expliquer les données manquantes
de façon aléatoire: n’est pas attribuable aux caractéristiques du participant
- questionnaire perdu, perte des coordonnées du participant, erreur se codage…
de façon non-aléatoire: attribuable aux carac. du participant/biais de l’étude.
- ne sait pas lire ou écrire, décide de ne pas répondre à certaines questions, ne peut pas participer à l’étude car incarcéré/hospitalisé…
Difficile à savoir si aléatoire ou pas. Analyses statistiques pour vérifier, être certains que on ne crée pas de biais à l’étude en retirant certaines variables.
Si données manquantes aléatoires et/ou moins de 5-10% des données sont manquantes = moins problématique
Expliquer l’inspection de la normalité de la distribution
- Cloche
- symétrique par rapport à la droite verticale qui passe par la moyenne
- le mode, la médiane et la moyenne ont la même valeur
- Point le plus élevé = valeur la plus commune
RÈGLE EMPIRIQUE
68,3% des observation se situent à +- 1 écart type de la moyenne
95,4% se situent à +- 2 écarts types de la moyenne
99,7% se situent +- 3 écarts types de la moyenne
Qu’est-ce que la symétrie ?
Mode = moyenne = médiane
Courbe normale
Qu’est-ce que l’asymétrie ?
A) négative
mode plus grand que médiane, plus grande que moyenne
concentration des valeurs fortes/élevées et peu de valeurs faibles
B) positive
mode plus petit que médiane, plus petite que moyenne
concentration des valeurs faibles/peu élevées
Qu’est-ce que l’aplatissement ?
A) Mésokurtique : courbe normale (cloche)
B) Leptokurtique : courbe élancée
haute concentration de cas qui prennent les valeurs égales ou proches de la moyenne
peu de variation = homogénéité
C) Platikurtique : courbe plate
cas s’éloignent de la moyenne
forte variation = hétéro
Quelles sont les conditions nécessaires à la causalité?
- séquence temporelle - la cause doit précéder l’effet (X cause Y)
- association entre X et Y
- la relation persiste même si on inclut d’autres variables
- les deux concepts (cause et effet) doivent être conceptuellement distincts
- il existe une interprétation possible de la relation - support théorique
Quels sont les 2 buts (qui influencent la façon dont on va écrire l’hypothèse de recherche) de l’analyse statistique ?
- connaître l’association entre deux variables
- le contrôle social informel est-il associé au nombre de crimes commis dans un quartier ? - connaître les différences de groupes pour une même variable
- existe-t-il une différence au niveau du nombre de crimes commis selon le sexe ?
Q’est-ce que l’hypothèse non-directionnelle?
aucune mention du sens de la relation entre les deux variables / des différences existantes
on ne dit pas ce qu’on pense observer
afin d’accepter l’hypothèse de recherche, il doit exister une relation significative, peu importe le sens de cette relation
Qu’est-ce que l’hypothèse directionnelle ?
le sens de la relation / des différences sont mentionnées
afin d’accepter l’hypothèse de recherche, le sens de la relation doit aussi s’avérer juste
qu’est-ce que l’hypothèse de recherche (H1)
présence d’une association entre VI et VD
qu’est-ce que l’hypothèse nulle (H0)?
aucune association entre VI et VD
pas de différences hommes-femmes pour le nb de crimes commis
important de tjrs revenir à H0 car procédures statistiques ne permettent pas d’accepter H1
- rejet de H0
- non-rejet de H0
Qu’est-ce que la théorie probabiliste ?
Probabilité (P) d’un événement
nombre de fois qu’un événement ou une situation survient divisé par le nb d’occasions que l’événement ou la situation puissent survenir
Qu’est-ce que l’inférence statistique ?
Induire les caractéristiques inconnues d’une population à partir d’un échantillon issu de cette pop.
information connue (échant.) —–inférence—– conclusion sur quelque chose d’inconnu (pop.)
L’analyse de l’échantillon ne nous renseigne sur la population que s’il représente adéquatement cette pop. (généralisation, basé sur analyses statistiques)
quelles sont les erreurs d’échantillonnage?
Loi des grands nombres : plus la taille de l’échantillon est grande, plus l’erreur d’échantillonnage est petite
plus grande est la variance de la pop., plus grande est l’erreur d’échant. (plus hétéro.)
BUT: gros échantillon d’une pop. assez homogène
Quel est le but de l’inférence statistique ?
déterminer si les différences observées sont le reflet de réelles différences au sein de notre population ou le résultat de possible d’une erreur d’échantillonnage/hasard
l’inférence n’est possible que dans la mesure où le phénomène respecte le postulat de la loi normale
Qu’est-ce qu’une analyse paramétrique ?
- les variables respectent le postulat de la normalité
- loi normale existe juste pour les variables continues quanti
- au moins une variable doit être quanti
Qu’est-ce qu’une analyse non-paramétrique ?
- nominales
- ordinales QUALI
ou
- variables quanti non-normalisées
Rigueur même si postulat de la normalité n’est pas respecté
Qu’est-ce que le seuil de signification ?
Seuil d’erreur qu’on considère acceptable
- en sciences sociales on veut contrôler ++ le type d’erreur 1
*p plus petit ou égal à 0,05 (ou 95%) = p de base
Nous voulons être certains à au moins 95% que la relation observée est attribuable à la présence d’une relation réelle entre les variables à l’étude
5% (.05) de chance de me tromper en affirmant qu’il existe une relation