Cours 7 Flashcards
Quels sont les 3 types d’analyses?
- Analyse univariée = 1 variable
- Analyse bivariée = 2 variables
- Analyse multivariée = 3 variables ou plus
En quoi consiste une analyse univariée?
Analyse univariée = 1 variable
- Elle permet de décrire et de présenter les données pour chaque variable:
- On fait ça pour tenter d’expliquer aux gens pourquoi on a fait ces analyses. Expliquer les modalités qu’elles ont pour présenter les variables avec lesquelles on travaille.
- Manipulations nécessaires: on va expliquer les raisons pour lesquelles ont a fait telles ou telles manipulations.
En quoi consiste une analyse bivariée ?
Analyse bivariée = 2 variables
- Elle consiste à analyser l’effet d’une variable indépendante (X) sur une variable dépendante (Y);
- Ex: Est-ce que le sexe d’une personne influence le nombre de crimes commis?
En quoi consiste une analyse multivariée?
Analyse multivariée = 3 variables ou +
- Analyser l’effet de plusieurs variables (X; Z; W) sur une variable dépendante (Y) pour contrôler l’effet de «variables tierces».
Quelles sont les 5 conditions nécessaires à la causalité?
-
Une séquence temporelle – la cause doit précéder l’effet (X cause Y):
- Sinon ∅ une relation de causalité.
-
Une association entre X et Y; X et Y sont présents:
- Les 2 variables doivent toujours être présentes sinon ∅ une relation de causalité.
-
La relation persiste même si on inclut d’autres variables (influence de variables tierces):
- Si en enlevant des variables contrôles (ex: la pauvreté) la relation de causalité entre X et Y tombe, ça veut dire que ce n’était pas une relation dès le départ.
- Important de mesurer l’influence des variables contrôles dans la relation pour s’assurer qu’on a une relation de causalité.
- Les deux concepts (cause et effet) doivent être conceptuellement distincts;
- Il existe une interprétation possible de la relation.
Quels sont les 2 buts de l’hypothèse selon les types d’analyses statistiques?
- Connaître l’association entre deux variables:
- On parle d’association et non d’explication – variable quantitative.
- Ex: Le contrôle sociale informel est-il associé au nombre de crimes commis dans un quartier?
- Connaître les différences de groupes pour une même variable:
- Permet de nommer des différences et de faire des comparaisons entre les groupes puisqu’on a des modalités dans ces variables – variable qualitative.
- Ex: Existe-t-il une différence au niveau du nombre de crimes commis selon le sexe (homme vs femme)?
Quels sont les 2 types d’hypothèse?
- Hypothèse non directionnelle
- Hypothèse directionnelle
Qu’est-ce qui caractérise une hypothèse non directionnelle?
L’hypothèse non directionnelle ne fait aucune mention du sens de la relation entre les deux variables/des différences existantes.
- Afin d’accepter l’hypothèse de recherche, il doit exister une relation significative, peu importe le sens de cette relation.
Exemples:
- Il existe une différence au niveau du nombre de crimes commis selon le sexe (homme vs femme).
- Le contrôle social informel est associé au nombre de crimes commis dans un quartier.
- Ce sont 2 H1 (hypothèse de recherche) qui n’ont pas de direction.
Qu’est-ce qui caractérise une hypothèse directionnelle?
Dans une hypothèse directionnelle, le sens de la relation/les différences existantes sont mentionnées.
- Afin d’accepter l’hypothèse de recherche (H1), le sens de la relation doit aussi s’avérer juste.
Exemples:
- Les hommes commettent, en moyennent, plus de crimes que les femmes;
- Un niveau de contrôle social informel faible est associé à un plus grand nombre de crimes commis dans un quartier.
En ce qui concerne les hypothèses, par convention et avant tout, il s’agit de vérifier quoi?
Il s’agit de vérifier la présence d’une association entre des variables (ou différences de groupes) qui soit statistiquement significative (non directionnelle/ bilatérale/2-tailed).
- Significative unilatérale = il y a une direction qui a été donnée;
- Significative bilatérale = il n’y a pas de direction donnée.
Quelles sont les 2 hypothèses en recherche?
-
Hypothèse de recherche (H1): présence d’une association/relation entre la VI et la VD
- Ex: Il existe une différence au niveau du nombre de crimes commis selon le sexe (homme vs femme).
-
Hypothèse nulle (H0): l’inverse de H1; aucune association/relation entre VI et VD
- Ex: Il n’existe pas de différence au niveau du nombre de crimes commis selon le sexe (homme vs femme).
Pourquoi est-il important de toujours revenir à l’hypothèse nulle (H0) en recherche?
Parce que les procédures statistiques ne permette pas d’accepter H1 …
- Dans le cas du rejet de H0 (ça veut dire qu’il y a une relation statistiquement significative) ⇒ H1 est nécessairement vraie.
- Dans le cas du non-rejet de H0 (≠ de relation significative).
- Mais, ça ne veut pas forcément dire que H1 est fausse…
Bref, le fait que je sois obligée de rejeter ma H0, signifie que je sais qu’il y a une relation, mais ça ne veut pas dire que je suis sûre à 100% que ma H1 soit vraie. On ne peut pas dire qu’on accepte notre H1, mais on peut dire qu’on rejette notre H0.
Qu’est-ce qui caratérise la population (N) ?
La population (N) est l’ensemble de toutes les personnes, objets ou faits sur lesquels porte une étude.
- On va définir la population ciblée en spécifiant:
- Unité statistique;
- Caractéristiques géographiques et temporelles.
- Mais… accès à toute la population = souvent difficile et couteux.
Qu’est-ce qui caractérise l’échantillon (n) ?
L’échantillon (n) est un sous-ensemble des observations/unités extrait d’une population.
- Dès qu’on choisit de prendre un échantillon plutôt que la population, on crée un biais puisqu’on ne sera jamais aussi près de ce qu’on veut observer que si on avait la population directe.
En quoi la fluctuation des échantillons est un problème fondamental ? (3)
C’est un problème fondamental parce que…
- La plupart des études sont basées sur des échantillons;
- Les statistiques obtenues à partir des échantillons peuvent varier d’une étude à l’autre:
- = estimation de la population/probabilités
- Notre échantillon est une estimation de la population, donc nécessairement on va avoir un biais par rapport à notre échantillon.
- Importance de reproduire les études
- = estimation de la population/probabilités
- Les divergences entre les statistiques émanant de la population des échantillons.