Cours 6 Flashcards

1
Q

Nommez les 3 types d’analyse possibles

A
  1. Univarié
  2. Bivariée
  3. Multivarié
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Expliquer le type d’analyse Univarié

A

Univarié = 1 variable (sert à décrire échantillon par exemple)

  1. Manipulations nécessaires? (recodage à faire, valeur manquante)
  2. Décrire et présenter les données pour chaque variable
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Expliquer le type d’analyse Bivariée

A

Bivariée = 2 variables

  1. Analyser l’effet d’une variable (X) sur une autre (Y)
  2. Est-ce que l’âge au premier crime influence le nombre de crimes commis au cours d’une carrière criminelle?
  3. Donc: évaluer l’effet d’une variable indépendante sur une variable dépendante
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Expliquer le type d’analyse Multivariée

A

Multivariée = 3 variables ou +

  1. Analyser l’effet de plusieurs variables (X;Z;W) sur une autre (Y)
  2. Contrôler pour l’effet de « variables tierces »

*L’effet de plusieurs variable indépendante (XZW) ensemble, sur une variable dépendante (y)

*L’effet de chacune des valeurs indépendante seul (z), sur la variable dépendante (y)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quel est l’ordre de présentation des variables dans une question de recherche ?

A

La VD va toujours être la dernière variable présentée dans la question, à la suite de la variable indépendante.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vrai ou faux, il est très rare qu’on va observer une causalité en sciences sociales en raison du phénomène multidimensionnel de l’humain. Plus présent dans les sciences naturelles..

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quel sont les 5 principes pour dire qu’on parle de causalité ?

A

(1) Séquence temporelle - la cause doit précéder l’effet (X cause Y)

*Ma variable indépendante va tjr précéder la variable dépendante dans le temps (par exemple, la victimisation doit précéder les conséquences psychologique, pour expliquer le liens entre les deux)

(2) Association entre X et Y; X et Y sont présents

*Cette association doit toujours être observable entre X et Y. Par exemple on doit toujours observer une association entre la pauvreté et la criminalité… ce qui explique pourquoi il est difficile d’avoir de causalité en sciences sociales..

(3) La relation persiste même si on inclut d’autres variables (influence de variables tierces/contrôle?)

(4) Les deux concepts (cause et effet) doivent être conceptuellement distincts

*Les variables doivent mesurer deux choses différentes

*Par exemple: le nb de maison habité et le nombre de déménagements ne respecte pas la règle puisqu’elle mesures les deux la même chose..

(5) Il existe une interprétation possible de la relation

*Si on observe une relation entre les deux variables, mais qu’aucune théorie existante nous permet de faire une interprétation de cette relation, on ne parle donc pas d’une causalité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quel sont les 2 buts de l’analyse statistique ?

A

(1) Connaître l’association entre deux variables (et non les concepts)

*EX : Le contrôle social informel est associé au nombre de crimes commis dans un quartier ?

(2) Connaître les différences de groupes pour une même variable

*EX : Il y a une différence au niveau de la fréquence des crimes dans un quartier selon le type d’établissements qui s’y trouvent.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Nommez les 4 types d’hypothèses

A
  1. Non directionnelle
  2. Directionnelle
  3. Hypothèse de recherche (H1 )
  4. Hypothèse nulle (H0 )
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Expliquer l’hypothèse Non directionnelle

A
  1. Aucune mention du sens de la relation entre les deux variables/des différences existantes

*EX : Il existe une différence quant à la fréquence des crimes dans un quartier selon le type d’établissements qui s’y trouvent.

*EX : Le contrôle social informel est associé au nombre de crimes commis dans un quartier

  1. Afin d’accepter l’hypothèse de recherche, il doit exister une relation significative, peu importe le sens de cette relation (puisqu’on ne dit pas plus ou moins dans notre hypothèse)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Expliquer l’hypothèse directionnelle

A
  1. Le sens de la relation/les différences existantes sont mentionnées

*EX: Plus de crimes sont commis dans les quartiers qui hébergent des bars ou encore des écoles;

*EX: Un niveau de contrôle social informel faible est associé à un plus grand nombre de crimes commis

  1. Afin d’accepter l’hypothèse de recherche, le sens de la relation doit aussi s’avérer juste.
  2. Par convention, avant tout : il s’agit de vérifier la présence d’une association entre des variables (ou différences de groupes) qui soit statistiquement significative (non directionnelle/bilatérale/2-tailed)

Quand on fait une analyse bivarié, par défaut on va plus souvent tester pour des hypothèses non directionnel (retenir pour examen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quel type d’hypothèse fait on par défaut, lorsqu’il est question d’une analyse bivarié ?

A

Quand on fait une analyse bivarié, par défaut on va plus souvent tester pour des hypothèses non directionnel (retenir pour examen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Expliquer l’hypothèse de recherche (H1)

A
  1. Présence d’une association/relation entre VI et VD

EX: Il existe une différence quant à la fréquence des crimes dans un quartier selon le type d’établissements qui s’y trouvent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Expliquer l’hypothèse nulle (H0)

A
  1. L’inverse de H1 ; aucune association/relation entre VI et VD

EX: Il n’existe pas de différence quant à la fréquence des crimes dans un quartier selon le type d’établissements qui s’y trouvent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vrai ou faux, dans chaque hypothèse, qu’elle soit directionnelle ou non directionnelle, il y a toujours une hypothèse de recherche (H1) et une hypothèse nulle (h0) ?

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Pourquoi est-il important de toujours revenir à l’hypothèse nulle en sciences sociales ?

A

On ne va jamais dire qu’on rejette ou qu’on adhère à notre hypothèse de recherche (H1) pour qu’on puisse revenir plus tard (raison de prudence), si un erreur d’échantillonnage, par exemple, devait arriver.

Donc: Les procédures statistiques ne permettent pas d’accepter H1…

17
Q

Puisque les procédures statistiques ne permettent pas d’accepter H1…

Donc, comment pouvons-nous interpréter notre Hypothèse nulle (H0) ?

A
  1. Rejet de H0 (relation statistiquement significative) → H1 est nécessairement vraie
  • On peut seulement rejeter l’hypothèse nulle si on obtient une relation statistique significative
  1. Non-rejet de H0 (≠ de relation significative)
  • Ne veut pas forcément dire que H1 est fausse…
  • Puisqu’on demeure prudent, on ne veut jamais affirmer que le H1 est nécessairement faux si on n’a pas établi de relation significative.

*Dans la rédaction : Je peux “conserver” mon hypothèse nulle au lieu de dire non-rejet

18
Q

Qu’est qu’une population ?

A
  1. Population (N): Ensemble de toutes les personnes, objets ou faits sur lesquels porte une étude.
  2. Définir la population ciblée en spécifiant:
  • Unité statistique : chaque élément de la population est appelé unité statistique.
  • Caractéristiques géographiques et temporelles
    Ex : Les délinquants sexuels Québécois entre 2005 et 2010
  • Mais… accès à toute la population = souvent difficile et coûteux
    s’en tient souvent à faire seulement de la recherche à partir d’un échantillon
19
Q

Qu’est qu’un échantillon ?

A
  1. Échantillon (n): sous-ensemble des observations/unités extrait d’une population.
  2. Importance de la représentativité de l’échantillon
  3. Généralisation des résultats
  • On veut que les caractéristiques de l’échantillon représentent le plus la population, qu’il soit à l’image, pour pouvoir généraliser.
  • Par exemple, si j’étudie la délinquance sexuelle et que l’échantillon est exlcuisvement de femme, je ne peux pas généralsier mes résultats à tout les délinquants sexuelles (homme et femmes)
  1. Échantillon aléatoire
  • Choisi au hasard les unités statistiques de façon à obtenir un échantillon étant le plus représentatif possible de la population étudiée
  • Toutes les unités de la population ont la même chance d’être sélectionnées
20
Q

Vrai ou faux: Plus j’ai d’échantillons, plus j’ai d’individus et donc, plus je me rapproche de ce qu’on observe dans la population.

A

Vrai

21
Q

Qu’est que la fluctuation des échantillons et quels sont ses problématiques fondamentales ?

A
  1. La plupart des recherches sont basés sur un échantillon, qui elle peut varier énormément et fluctuer.
  2. Problème fondamental

a) La plupart des études sont basées sur des échantillons

b) Les statistiques obtenues à partir des échantillons peuvent varier d’une étude à l’autre

*= estimation de la population/probabilités

  • L’échantillon est une estimation de la population, ce qui ne garantit pas à 100% les résultats.
  • Importance de reproduire les études
  • Reproduire les études avec d’autres échantillons ( plus grands ou provenant de d’autres endroits) afin de vérifier que nos hypothèses sont réellement véridiques et que l’échantillon se veut un reflet de la population étudiée.
  • Plus j’ai des études avec des échantillons similaires, et qu’il ont des résultats similaires, plus ceux-ci seront fiables à plus grande échelle.

c) Divergences entre les statistiques qui découle de la population et des échantillons

p.ex: Échantillon uniquement d’hommes, américain.. ce qui peut être une limite

22
Q

Pourquoi est-il nécessaire d’avoir plusieurs échantillon dans une étude ?

A

Afin de se rapprocher le plus possible à la moyenne de la population, donc de la réalité observé dans la population.

Puisque dépendamment de l’échantillon que nous avons, cela fera en sorte que nous n’obtenons pas toujours les mêmes données.

23
Q

Vrai ou faux, l’échantillon représente un peu en soi les probabilités que cela se reproduise dans la population étudiée

A

Vrai, c’est donc une théorie probabiliste

24
Q

Qu’est que l’inférence statistique ?

A

Consiste à induire les caractéristiques inconnues d’une population à partir d’un échantillon issu de cette population

Et de tirer des conclusion sur quelque chose d’inconnu

*Est-ce que l’échantillon est assez représentatif statistiquement pour que je sois en mesure de prendre ce que j ‘observe dans l’échantillon et de l’amener à ma population.

25
Q

Vrai ou faux: L’analyse de l’échantillon ne nous renseigne sur la population que s’il représente adéquatement cette population

A

Vrai

26
Q

Que faut-il faire pour généraliser des résultats ?

A

Pour généraliser des résultats, il faut s’assurer que notre échantillon est assez représentatif de la population afin de tirer des résultats et l’appliquer à cette population.

27
Q

Comment pouvons-nous faire de l’inférence statistique ?***

A

Basée sur des analyses statistiques;

  1. C’est une méthode permettant de tirer des conclusions fiables sur la population, à partir de données obtenues pour l’échantillon (généralisation des résultats)
  • Permet de minimiser les probabilités de tirer de fausses conclusions quant aux paramètres de la population
  1. Puisque nous inférons les données de notre population à partir d’un échantillon (aléatoire)
  • possibilité que les résultats trouvés soient attribuables au hasard/erreur d’échantillonnage
28
Q

Que faut-il faire pour éviter les erreur d’échantillonnage ?**

A
  1. Loi des grands nombres: plus la taille de l’échantillon est grande, plus l’erreur d’échantillonnage est petite.
  2. Plus grande est la variance de la population, plus grande est l’erreur d’échantillonnage
  • le but est que l’échantillon soit le plus homogène possible pour réduire la variance de la population
29
Q

Quel est le but de l’inférence statistique ?*****

A
  1. Son but est de déterminer si les différences observées sont le reflet de réelles différences au sein de notre population ou le résultat possible d’une erreur d’échantillonnage/hasard

1.1 L’inférence n’est possible que dans la mesure où le phénomène respecte le postulat de la Loi normal

  • Notre variable quantitative doit toujours être normalement distribué afin de faire l’inférence

(variable quantitative)

30
Q

Quel sont les 2 types d’erreur d’inférence ? Expliquez les *****

A

A) Erreur de type 1

  • Consiste à dire qu’il existe un lien entre mes variables (affirmation au départ du chercheur), alors qu’en réalité il n’en existe pas.

*Par exemple, dire qu’un individu est coupable, mais qu’en réalité il est innocent.

B) Erreur de type 2

  • Consiste à dire que lorsque que l’affirmation du chercheur dit qu’il n’existe pas de lien alors que dans la réalité, il en a un.

*Par exemple, dire qu’un individu est innocent, mais qu’en réalité il est coupable.

31
Q

Vrai ou faux: En pratique, il est considéré beaucoup plus grave de faire une erreur de type 1 que de type 2

A

Vrai.

Type 1: Consiste à dire qu’il existe un lien entre mes variables (affirmation au départ du chercheur), alors qu’en réalité il n’en existe pas.

32
Q

Qu’est qu’un seuil de signification et à quoi sert-il ? **

A
  • Malgré la possibilité de faire des erreurs d’inférence (type 1 et 2), on se fixe un seuil d’erreur minimal à atteindre
  • On contrôle le plus possible l’erreur de type 1

Son utilité:
1. Pour contrôler l’erreur de type 1

  1. Pour déterminer s’il y a une relation statistiquement significative entre nos VD et VI.
33
Q

Expliquer le seuil de signification généralement accepté: * p ≤ 0.05 (ou 95%) en sciences sociales *****

A
  1. Nous voulons être certain à au moins 95% que la relation observée est attribuable à la présence d’une relation réelle entre les variables à l’étude
  2. 5% (.05) de chance de me tromper en affirmant qu’il existe une relation (erreur de type 1). On tolère une marge d’erreur de 5% en sciences sociales
34
Q

Expliquer le seuil de signification accepté en sciences de la nature: * p ≤ 0.01,

A
  1. Certain à 99% qu’il existe une relation statistiquement significative entre mes variables
  2. Ou il y a une chance de 1% de commettre une erreur en affirmant qu’il existe une relation.
35
Q

Qu’arrive t’il à mon hypothèse (h0), si mon seuil de signification est: p ≤ 0.05 ? *****

A

Si p ≤ 0.05, nous pouvons rejeter H0 et conclure qu’il existe une relation significative entre la VI et VD (Rejet de H0 ; H1 = vrai/vérifiée)

36
Q

Qu’arrive t’il à mon hypothèse (h0), si mon seuil de signification est: p > 0.05 ****

A

Si p > 0.05, nous ne pouvons pas conclure qu’il existe une relation réelle entre la VI et VD (qui ne soit pas attribuable à une erreur d’échantillonnage) et devons conserver l’hypothèse nulle (non-rejet de H0 ; H1 ne peut pas être vérifiée)

37
Q

Qu’est que le coefficient de alpha ? **

A
  • La probabilité de faire une erreur de type 1= alpha (α); « p » = seuil de signification