Cours 7 Flashcards

1
Q

Quels sont les 3 types d’analyses?

A
  1. Analyse univariée = 1 variable
  2. Analyse bivariée = 2 variables
  3. Analyse multivariée = 3 variables ou plus
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

En quoi consiste une analyse univariée?

A

Analyse univariée = 1 variable

  • Elle permet de décrire et de présenter les données pour chaque variable:
    • On fait ça pour tenter d’expliquer aux gens pourquoi on a fait ces analyses. Expliquer les modalités qu’elles ont pour présenter les variables avec lesquelles on travaille.
  • Manipulations nécessaires: on va expliquer les raisons pour lesquelles ont a fait telles ou telles manipulations.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

En quoi consiste une analyse bivariée ?

A

Analyse bivariée = 2 variables

  • Elle consiste à analyser l’effet d’une variable indépendante (X) sur une variable dépendante (Y);
  • Ex: Est-ce que le sexe d’une personne influence le nombre de crimes commis?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

En quoi consiste une analyse multivariée?

A

Analyse multivariée = 3 variables ou +

  • Analyser l’effet de plusieurs variables (X; Z; W) sur une variable dépendante (Y) pour contrôler l’effet de «variables tierces».
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelles sont les 5 conditions nécessaires à la causalité?

A
  1. Une séquence temporelle – la cause doit précéder l’effet (X cause Y):
    • Sinon ∅ une relation de causalité.
  2. Une association entre X et Y; X et Y sont présents:
    • Les 2 variables doivent toujours être présentes sinon ∅ une relation de causalité.
  3. La relation persiste même si on inclut d’autres variables (influence de variables tierces):
    • Si en enlevant des variables contrôles (ex: la pauvreté) la relation de causalité entre X et Y tombe, ça veut dire que ce n’était pas une relation dès le départ.
    • Important de mesurer l’influence des variables contrôles dans la relation pour s’assurer qu’on a une relation de causalité.
  4. Les deux concepts (cause et effet) doivent être conceptuellement distincts;
  5. Il existe une interprétation possible de la relation.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quels sont les 2 buts de l’hypothèse selon les types d’analyses statistiques?

A
  1. Connaître l’association entre deux variables:
    • On parle d’association et non d’explication – variable quantitative.
    • Ex: Le contrôle sociale informel est-il associé au nombre de crimes commis dans un quartier?
  2. Connaître les différences de groupes pour une même variable:
    • Permet de nommer des différences et de faire des comparaisons entre les groupes puisqu’on a des modalités dans ces variables – variable qualitative.
    • Ex: Existe-t-il une différence au niveau du nombre de crimes commis selon le sexe (homme vs femme)?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quels sont les 2 types d’hypothèse?

A
  1. Hypothèse non directionnelle
  2. Hypothèse directionnelle
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce qui caractérise une hypothèse non directionnelle?

A

L’hypothèse non directionnelle ne fait aucune mention du sens de la relation entre les deux variables/des différences existantes.

  • Afin d’accepter l’hypothèse de recherche, il doit exister une relation significative, peu importe le sens de cette relation.

Exemples:

  • Il existe une différence au niveau du nombre de crimes commis selon le sexe (homme vs femme).
  • Le contrôle social informel est associé au nombre de crimes commis dans un quartier.
  • Ce sont 2 H1 (hypothèse de recherche) qui n’ont pas de direction.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce qui caractérise une hypothèse directionnelle?

A

Dans une hypothèse directionnelle, le sens de la relation/les différences existantes sont mentionnées.

  • Afin d’accepter l’hypothèse de recherche (H1), le sens de la relation doit aussi s’avérer juste.

Exemples:

  • Les hommes commettent, en moyennent, plus de crimes que les femmes;
  • Un niveau de contrôle social informel faible est associé à un plus grand nombre de crimes commis dans un quartier.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

En ce qui concerne les hypothèses, par convention et avant tout, il s’agit de vérifier quoi?

A

Il s’agit de vérifier la présence d’une association entre des variables (ou différences de groupes) qui soit statistiquement significative (non directionnelle/ bilatérale/2-tailed).

  • Significative unilatérale = il y a une direction qui a été donnée;
  • Significative bilatérale = il n’y a pas de direction donnée.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelles sont les 2 hypothèses en recherche?

A
  • Hypothèse de recherche (H1): présence d’une association/relation entre la VI et la VD
    • Ex: Il existe une différence au niveau du nombre de crimes commis selon le sexe (homme vs femme).
  • Hypothèse nulle (H0): l’inverse de H1; aucune association/relation entre VI et VD
    • Ex: Il n’existe pas de différence au niveau du nombre de crimes commis selon le sexe (homme vs femme).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Pourquoi est-il important de toujours revenir à l’hypothèse nulle (H0) en recherche?

A

Parce que les procédures statistiques ne permette pas d’accepter H1

  • Dans le cas du rejet de H0 (ça veut dire qu’il y a une relation statistiquement significative) ⇒ H1 est nécessairement vraie.
  • Dans le cas du non-rejet de H0 (≠ de relation significative).
    • Mais, ça ne veut pas forcément dire que H1 est fausse…

Bref, le fait que je sois obligée de rejeter ma H0, signifie que je sais qu’il y a une relation, mais ça ne veut pas dire que je suis sûre à 100% que ma H1 soit vraie. On ne peut pas dire qu’on accepte notre H1, mais on peut dire qu’on rejette notre H0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce qui caratérise la population (N) ?

A

La population (N) est l’ensemble de toutes les personnes, objets ou faits sur lesquels porte une étude.

  • On va définir la population ciblée en spécifiant:
    • Unité statistique;
    • Caractéristiques géographiques et temporelles.
  • Mais… accès à toute la population = souvent difficile et couteux.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce qui caractérise l’échantillon (n) ?

A

L’échantillon (n) est un sous-ensemble des observations/unités extrait d’une population.

  • Dès qu’on choisit de prendre un échantillon plutôt que la population, on crée un biais puisqu’on ne sera jamais aussi près de ce qu’on veut observer que si on avait la population directe.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

En quoi la fluctuation des échantillons est un problème fondamental ? (3)

A

C’est un problème fondamental parce que…

  • La plupart des études sont basées sur des échantillons;
  • Les statistiques obtenues à partir des échantillons peuvent varier d’une étude à l’autre:
    • = estimation de la population/probabilités
      • Notre échantillon est une estimation de la population, donc nécessairement on va avoir un biais par rapport à notre échantillon.
    • Importance de reproduire les études
  • Les divergences entre les statistiques émanant de la population des échantillons.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce qu’est une probabilité (P) ?

A

Une probabilité (P) est le nombre de fois qu’un événement ou une situation survient divisé par le nombre d’occasions que l’événement ou la situation puisse survenir.

  • Il faut voir l’échantillonnage de la même façon qu’une probabilité. Si on ne sait pas qu’il nous faut tel nombre d’hommes et tel nombre de femmes, par exemple, pour que notre échantillon soit représentatif, c’est sûr qu’il ne le sera pas.
17
Q

En allant chercher aléatoirement des individus pour former notre échantillon, on va nécessairement avoir des biais aléatoires.

Comment faire pour limiter ces biais?

A

On va essayer d’avoir le plus grand nombre d’individus possible dans notre échantillon pour se rapprocher le plus possible de la population.

18
Q

Si le nombre d’échantillons et d’observations augmentent, est-ce que la moyenne sera plus près de la moyenne populationnelle?

A

Oui, plus on a de gens, plus on se rapproche de la population, donc plus la moyenne de notre échantillon sera près de celle de la population.

Plus on a de personnes, plus on va se rapprocher de la réalité populationnelle.

19
Q

En quoi consiste l’inférence statistique?

A

Elle consiste à induire les caractéristiques inconnues d’une population à partir d’un échantillon issu de cette population.

20
Q

Vrai ou faux.

**L’analyse de l’échantillon ne nous renseigne sur la population que s’il représente adéquatement cette population** → Généralisation

A

Vrai

Tant que mon échantillon est représentatif de la population, mon inférence statistique est correcte, donc on est capable de faire la généralisation des résultats.

  • Parce que je sais que j’ai un échantillon valide et représentatif, je sais que je peux faire des généralisations à la population complète.
21
Q

Sur quoi est basée l’inférence statistique?

A

Sur des analyses statistiques.

22
Q

Qu’est-ce que permet l’inférence statistique? (2)

A

L’inférence statistique permet…

  1. De tirer des conclusions fiables sur la population, à partir de données obtenues pour l’échantillon (généralisation des résultats).
  2. De minimiser les probabilités de tirer de fausses conclusions quant aux paramètres de la population.
23
Q

En ce qui concerne l’inférence statistique, puisque nous inférons les données de notre population à partir d’un échantillon (aléatoire)…

A

… il est possible que les résultats trouvés soient attribuables au hasard/erreur d’échantillonnage.

24
Q

Qu’est-ce qu’il faut savoir concernant l’erreur d’échantillonnage?

A
  • La loi des grands nombres: plus la taille de l’échantillon est grande, plus l’erreur d’échantillonnage est petite.
  • Plus grande est la variance de la population, plus grande est l’erreur d’échantillonnage.
    • Plus notre écart-type est grand, plus il est difficile d’avoir un échantillon représentatif.
  • Elle est calculée grâce à l’erreur type de la moyenne.
25
Q

Quel est le but de l’inférence statistique?

A

Déterminer si les différences observées sont le reflet de réelles différences au sein de notre population ou le résultat possible d’une erreur d’échantillonnage/ hasard.

  • L’inférence n’est possible que dans la mesure où le phénomène respecte le postulat de la Loi normale.
26
Q

Quels sont les 2 types d’erreurs d’inférence?

A
  1. L’erreur alpha: C’est que le chercheur affirme qu’il existe un lien (H1; rejet de H0) alors qu’il n’existe pas de lien.
    • Ex: au procès, dire que la personne a commis le délit alors que ce n’est pas vrai.
  2. L’erreur bêta: c’est que le chercheur affirme qu’il n’existe pas de lien (non-rejet de H0) alors qu’en réalité il existe un lien.
    • Ex: au procès, dire que la personne n’a pas commis le délit alors qu’en réalité c’est vrai et il va récidiver.
27
Q

Que faut-il savoir concernant le seuil de signification?

A

Malgré la possibilité de faire des erreurs d’inférence (type 1 et 2), on se fixe un seuil d’erreur acceptable

  • En sciences sociales, on préfère contrôler le plus possible l’erreur de type 1
    • La probabilité de faire une erreur de type 1 = alpha (𝛼); «p» = seuil de signification
28
Q

Quel est le seuil de signification généralement accepté en recherche?

A

Le seuil de signification généralement accepté :

  • * 𝑝 ≤ 0.05 (ou 95%)
    • Nous voulons être certain à au moins 95% que la relation observée est attribuable à la présence d’une relation réelle entre les variables à l’étude.
    • 5% (0.05) de chance de me tromper en affirmant qu’il existe une relation (erreur de type 1)
  • ** 𝑝 ≤ 0.01, *** 𝑝 ≤ 0,001

Donc…

  • Si 𝑝 ≤ 0.05, nous pouvons rejeter H0 et conclure qu’il existe une relation significative entre la VI et la VD (Rejet de H0; H1 = vrai/vérifiée);
  • Si 𝑝 > 0.05, nous ne pouvons pas conclure qu’il existe une relation réelle entre VI et VD (qui ne soit pas attribuable à une erreur d’échantillonnage) et devons considérer l’hypothèse nulle (non-rejet de H0; H1 ne peut pas être vérifiée).
29
Q

Vrai ou faux.

On va plus souvent tester sans direction au niveau statistique puisqu’on veut seulement savoir s’il y a une association. On teste donc toujours des hypothèses non directionnelles pour analyser la relation et non la direction.

A

Vrai

30
Q

Pourquoi est-il important que notre échantillon (n) soit représentatif ? (3)

A
  • Notre étude quantitative ne vaut rien si notre échantillon n’est pas représentatif de la population;
  • Nécessaire à la généralisation des résultats;
  • Échantillon aléatoire
    • Toutes les unités de la population ont la même chance d’être sélectionnées.