semaine 4 - traitement de données quantitatives Flashcards

1
Q

C’est quoi les 6 étapes clés de traitement des données primaires dans la construction de base de données?

A
  1. saisie des données collectées
  2. épuration des données
  3. codage des variables à questions à réponses multiples
  4. enchaînements
  5. contrôle et imputation
  6. création de fichiers finaux de données et d’un dictionnaire de données
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

C’est quoi les règles qui guident le processus de coding

A

règles d’ordre général
règles d’ordre spécifique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

C’est quoi l’erreur de saisi?

A
  • subvenir lorsque la saisie est manuelle
  • erreur peut être détectée en présenant une distribution de fréquence des données
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

C’est quoi les 3 types de données manquantes?

A

sujets manquants: toutes les données relatives à un temps de mesure sont manquantes pour certaines unités statistiques

occasions manquantes: données relatives à un temps de mesure sont manquantes pour certaines unités stats

valeurs manquantes: données absentes parce que des répondants ont omis de répondre à certaine questions ou que des données pour calculer cette valeur ne sont pas dispo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Comment pouvont nous distribuée les données manquantes?

A

Complètement aléatoire: la probabilité qu’une valeur soit manquantepour une variable donnée ne depend pas de cette variable ni d’aucune autre variable

Aléatoire: la probabilité qu’une valeur soit manquante pour une variabledonnée ne depend pas de cette variable, mais est liée à d’autres variablesde la base

Non aléatoire: la probabilité qu’une valeur soit manquante pour une valeur donnée depend de la valeur de cette variable elle-même

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

C’est quoi les 5 grandes catégories de méthodes de traitement des données manquantes?

A

Méthodes d’élimination
Méthodes de substitution
Méthode d’imputation simple
Méthode d’estimation du maximum de vraisemblance
Imputation multiple

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

C’est quoi la simple élimination et l’élimination appariée?

A

Simple élimination
- exclure de l’analyse toutes les unités statistiques pour lesquels au moins une valeur est manquantes pour les variables impliquées dans l’analyse
Élimination appariée
- Créer une matrice de corrélations ou de variances-covariances pour laquelle chaque couple de variables est pris deux à deux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Chaque donnée manquante pour un répondant est remplacée par une valeur choisie aléatoirement à partir des réponses des répindants similaires

A

(Méthodes de subsitution) Remplacement de type Hot-Deck

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Prédire les valeurs attribuées aux données manquantes avec une régression à partir des données disponibles

A

Imputation par équation de régression

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Valeur si extrême pour une variable (univariée), ou une combinaison si étrange
de réponses à un ensemble de variables (multivariée) pouvant biaiser les
résultats

A

Données aberrantes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Approches pour identifier les donnes aberrantes

A

Produire un tableau de fréquence pour observer les observations isolées
Produire des graphiques pour observer la variation de la variable
Calculer de nouvelles variables de référence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly