Chapitres 6 à 8 Flashcards

1
Q

Il y a deux méthodes d’échantillonnage. Quelles sont-elles?

A

Les méthodes probabilistes et non-probabilistes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quels sont les avantages des méthodes probabilistes?

A
  • La marge d’erreur est connue et quantifiable.

- Les résultats observés dans l’échantillon peuvent être généralisés à l’ensemble de la population (inférence).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Dans quelles situations devrait-on privilégier un échantillon probabiliste?

A
  • L’information issue de l’enquête doit être projetée à la population.
  • L’erreur doit être minimisée ou connue.
  • Le coût de l’erreur risque d’être élevé.
  • Dans une population hétérogène, inconnue.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles sont les méthodes d’échantillonnage probabiliste?

A
  • Échantillonnage aléatoire simple
  • Échantillonnage aléatoire stratifié (proportionnel et non proportionnel)
  • Échantillonnage en grappes
  • Échantillonnage systématique
  • Échantillonnage en phases successives (combinaison)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelles sont les méthodes d’échantillonnage non-probabiliste?

A
  • Échantillonnage selon le jugement
  • Échantillonnage de convenance
  • Échantillonnage par quota
  • Échantillonnage en boule de neige
  • Échantillonnage volontaire
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelles sont les caractéristiques de l’échantillonnage aléatoire simple?

A

Chaque échantillon a la même probabilité égale, connue et différente de zéro d’être sélectionné.

On présuppose que l’on dispose d’une liste de toute la population dont chaque élément est numéroté.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quelle est la procédure de l’échantillonnage stratifié?

A

Le chercheur doit choisir une variable de stratification qui aura pour effet de minimiser la variance de la variable à estimer à l’intérieur des strates et de maximiser la variance entre les strates.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quels sont les 4 facteurs qui influe sur la décision d’une stratification proportionnelle ou non?

A
  1. Le nombre d’éléments dans chaque strate de la population.
  2. L’importance relative des strates dans le cadre du projet.
  3. La variance dans chaque strate.
  4. Les coûts d’échantillonnage pour chaque strate.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce que le redressement d’un échantillon stratifié?

A

C’est une pondération des données selon les proportions relatives des catégories dans la population et dans l’échantillon.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelle est la procédure de l’échantillonnage en grappes?

A

On divise la population en sous-ensembles distincts qu’on appelle des grappes. On sélectionne ensuite un échantillon aléatoire de grappes. Tous les éléments qui composent les grappes choisies constituent l’échantillon final.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelle est la procédure de l’échantillonnage systématique?

A

On dispose les éléments de la population l’un à la suite de l’autre, sans ordre défini. Après un départ aléatoire, on choisit un élément à tous les k éléments.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelle est la procédure de l’échantillonnage en phases successives?

A

Il s’agit d’appliquer en séquence une combinaison de méthodes d’échantillonnage.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quelle est la procédure de l’échantillonnage selon le jugement?

A

On choisit des personnes qui semblent représentatives.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quelle est la procédure de l’échantillonnage de convenance?

A

On choisit les X premières personnes rencontrées.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelle est la procédure de l’échantillonnage par quotas?

A

On recrute des personnes à l’intérieur de sous-groupes selon des proportions imposées.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelle est la procédure de l’échantillonnage en boule de neige?

A

On demande au premier répondant de suggérer d’autres répondants potentiels.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

La taille de l’échantillon a une incidence sur 2 facteurs. Quels sont-ils?

A
  • Les coûts de l’étude

- La précision des résultats

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Dans la formule pour déterminer la taille de l’échantillon, que veulent dire chaque élément?

A

n = (B - (F + D)) / i

n = Taille de l'échantillon
B = Budget total pour l'étude
F = Frais fixes de la recherche
D = Frais divers
i = Coûts d'administration d'un questionnaire
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Plus un échantillon est grand, moins les résultats seront précis. Vrai ou faux?

A

FAUX. Plus un échantillon est grand, PLUS les résultats seront précis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Dans la formule pour déterminer la marge d’erreur d’un échantillon aléatoire simple, que veulent dire chaque élément?

A

E = t x [racine carrée de] (p x q) / n

E = Marge d'erreur
p = Proportion pourcentuelle obtenue dans l'échantillon (0.5 si on ne l'a pas)
q = 1 - p
t = Cote Z nécessaire à l'obtention d'un niveau de confiance de 95% (0.95) (1.96 si on ne l'a pas)
n = Taille de l'échantillon
21
Q

Quelle est la formule pour déterminer la marge d’erreur associée à une moyenne dans l’échantillon?

A

1.96 [racine carrée de] s2 / n x ((N -n) / N)

À noter : (N -n) / N On L’applique seulement si la population est de taille réduite par rapport à la taille de l’échantillon. On ne l’applique pas si on a pas l’info.

22
Q

Quelle est la formule pour déterminer la marge d’erreur d’une proportion dans l’échantillon?

A

1.96 [racine carrée de] p (1 - p) / n -1 x ((N -n) / N)

23
Q

Quels sont les types de biais possible ne découlant pas de l’échantillonnage?

A

Non-observation :

  • Couverture incomplète
  • Non-réponse

Observation :

  • Collecte des données
  • Traitement des données
24
Q

Comment faire pour éviter le biais d’une couverture incomplète?

A
  • Améliorer le cadre d’échantillonnage

- Ne pas utiliser de cadre d’échantillonnage

25
Q

Comment faire pour éviter le biais d’une non-réponse?

A
  • Augmenter le taux de contact (visites répétées, prise de rdv)
  • Recourir à des interviewers expérimentés
  • Offrir une compensation financière
  • Employer le modèle de réponse aléatoire
26
Q

Comment faire pour éviter le biais de la collecte des données?

A
  • Contrôler le travail des interviewers
27
Q

Comment faire pour éviter le biais du traitement des données?

A
  • Vérifier et nettoyer la base de données

- Vérifier la cohérence des analyses

28
Q

Quelles sont les types de variables dans les analyses univariées?

A

Les variables non-métriques et métriques.

29
Q

Quelles sont les mesures de tendance centrale?

A
  • Moyenne
  • Médiane (valeur centrale de la distribution, elle est située au milieu)
  • Mode (valeur la plus fréquente)
30
Q

Quelles sont les mesures de distribution?

A
  • Minimum
  • Maximum
  • Variance (la somme des écarts à la moyenne, divisée par n-1)
  • (et l’écart-type)
31
Q

Quels sont les deux types de relations bivariées?

A

Relations de dépendance et d’interdépendance.

32
Q

Comment choisi-t-on la technique d’analyse appropriée?

A

Il faut vérifier s’il existe une relation entre une variable dépendante (à expliquer) et une autre indépendante (explicative).
S’il n’y a pas de lien de causalité entre les variables, on parle de relation d’interdépendance.

33
Q

Quelles sont les techniques d’analyse statistique bivariée et quand les utilise-t-on?

A

Variable 1 est nominale ou ordinale + Variable 2 est nominale ou ordinale = TABLEAU CROISÉ
Variable 1 est nominale ou ordinale + Variable 2 est d’intervalles ou de ratio = COMPARAISON DE MOYENNES
Variable 1 est d’intervalles ou de ratio + Variable 2 est nominale ou ordinale = COMPARAISON DE MOYENNES
Variable 1 est d’intervalles ou de ratio + Variable 2 est d’intervalles ou de ratio = CORRÉLATION OU RÉGRESSION

34
Q

Que doit-on faire pour aider la lecture d’un tableau croisé?

A

Le mettre en pourcentage.

*La variable dépendante est toujours à gauche et la variable indépendante, en haut du tableau.

35
Q

Qu’est-ce que la statistique khi carré?

A

C’est un indice de la distance entre les fréquences théoriques et les fréquences observées.
Plus sa valeur est grande, plus ont croit que les deux variables sont associées.
On conclut que la relation existe dans la population lorsque la valeur de khi carré est trop improbable (inférieur à 0.05).
L’analyse du khi carré est appropriée pour des variables mesurées à l’aide d’échelles nominales ou ordinales.

36
Q

Quelle est la formule utilisée pour calculer la force de la relation dans les tableaux croisés? Comment se nomme-t-elle et que veulent dire les éléments qui la composent?

A

Le V de Cramer

V = [racine carrée de] X2 / n(L - 1)

n = nombre d'observations (total des fréquences)
L = minimum des lignes et des colonnes du tableau
37
Q

Quand utilise-t-on la statistique gamma et à quoi sert-elle?

A

On l’utilise lorsque les deux variables sont mesurées à l’aide d’une échelle ordinale pour faire une analyse complémentaire.
Elle sert à mesurer le sens et la force de la relation entre deux variables ordinales.

38
Q

Quelle est la formule à utiliser dans une comparaison de deux moyennes indépendantes? Quelle est son nom et que veulent dire les éléments qui la composent?

A

La statistique t

t = (X1 - X2) / sd (voir dans les power points pour la formule plus claire)

X1 = moyenne du premier groupe
X2 = moyenne du deuxième groupe
(sd n’est pas à calculer)

39
Q

Quelles sont les caractéristiques de la statistique t dans la comparaison de deux moyennes indépendantes?

A

Elle correspond à la différence standardisée entre les deux moyennes.
Plus la valeur absolue de t est grande, plus on croit que les deux variables sont associées.
On conclut que la relation existe dans la population lorsque la valeur de t est trop improbable (inférieur à 0.05).

40
Q

Comment mesure-t-on la force de la relation d’une comparaison de deux moyennes indépendantes?

A

Avec la statistique êta.

41
Q

Quelle est la formule de la statistique êta?

A

n = [racine carrée de] t2 / t2 + n1 + n2 - 2 (voir les power points pour la formule pour claire)

42
Q

Dans quelle situation utilise-t-on le test en F?

A

Lors d’une comparaison de plusieurs moyennes indépendantes.

43
Q

Quelles sont les caractéristiques du test en F?

A

Il correspond au rapport de la variance expliquée sur la variance d’erreur.
Plus la valeur de F est grande, plus on croit que les deux variables sont associées.
On conclut que la relation existe dans la population lorsque la valeur de F est trop improbable (inférieur à 0.05).

44
Q

Quelle est la formule pour calculer la force de la relation dans une comparaison de plusieurs moyennes indépendantes et que veulent dire les éléments qui la composent?

A

n = [racine carrée de] SCG / SCT
(la statistique êta)

SCG = Somme des carrés entre les groupes
SCT = Somme des carrés totale
45
Q

Quels sont les deux options si l’on veut calculer la relation entre deux variables métriques?

A

La corrélation (pour une analyse de relations de dépendance ou d’interdépendance) et la régression (pour les relations de dépendance seulement).

46
Q

Quelles sont les caractéristiques de la corrélation?

A
  • Il varie de -1 (relation inverse) à +1 (relation positive).
  • Plus il est près de 0, moins la relation est forte entre les deux variables.
47
Q

Quelle est la formule utilisée lors de l’analyse de corrélation? Quelle est son nom et que veulent dire les éléments qui la composent?

A

La statistique t.

t = r / [racine carrée de] (1 - r2) / n - 2 (voir les power points pour la formule pour claire)

r = coefficient de corrélation
n = taille de l'échantillon
48
Q

Quelles sont les caractéristiques de la statistique t dans l’analyse de corrélation?

A
  • Plus la valeur absolue de t est grande, plus on croit que les deux variables sont associées.
  • On conclut que la relation existe dans la population lorsque la valeur de t est trop improbable (inférieur à 0.05).
49
Q

Quelles sont les 3 étapes à suivre lors de l’analyse bivariée?

A
  1. Interpréter les résultats.
  2. Vérifier si la relation entre les deux variables existe, si elle est statistiquement significative (pas à calculer, mais il faut repérer la valeur p (« sig. » ou « signification asymptotique ») et vérifier si celle-ci est inférieure à 0,05).
  3. Calculer la force de la relation (seulement si on répond oui à l’étape 2).