FINAL 9 - Traitement des données manquantes Flashcards

1
Q

Quelles sont les conséquences des données manquantes sur l’analyse ?

A

Perte d’informations pertinentes : impact dépend du nombre de données manquantes, possibilité de biais dans l’estimation de la précision et de l’exactitude

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quelle est la différence entre des données manquantes monotones et non monotones ?

A

Monotone : les données manquantes sont soit au début ou à la fin de l’analyse
Non monotone : absence de données en plein milieu de l’analyse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’une donnée manquante complètement au hasard MCAR ?

A

La probabilité d’avoir des données manquantes sur une variables Y dans un échantillon aléatoire simple d’une population est constante, donc ne dépend ni de X ni de Y
+ : pas de biais dans l’estimé
- : perte de précision / puissance dans la variance de l’estimé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce qu’un échantillon aléatoire simple ?

A
  1. Tous les individus ont la même probabilité d’être choisis dans l’échantillon
  2. Les individus doivent être représentatifs de la population
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Comment se calcule un biais ?

A

Biais = moyenne des estimés dans l’échantillon - moyenne dans la population ≠ 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce qu’une donnée manquante au hasard MAR ?

A

Probabilité d’avoir des données manquantes sur une variables Y dépend de X mais pas de Y
Ex : F (X = sexe) refusant de divulger son âge (Y = âge)
+ : pas de biais dans l’estimé avec des méthodes statistiques appropriées
- : perte de précision / puissance dans la variance de l’estimé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce qu’une donnée manquante non aléatoire MNAR ?

A

Probabilité d’avoir des données manquantes sur une variable dépend de Y
Ex : Individu $$ (Y = revenu) refuse de dévoiler son revenu (Y = revenu
- : perte de précision / puissance dans la variance de l’estimé, biais dans l’estimé, analyse de sensibilité nécessaire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles sont les méthodes de traitement des données manquantes ?

A
  1. Analyse de données complète
  2. Indicateur de données manquantes
  3. Imputation simple (dernière observation, par la moyenne, par regréssion)
  4. Imputation multiple
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

En quoi consiste l’analyse de données complète ?

A

Enlever de l’analyse les individus avec une ou des données manquantes
Applicable pour toutes les types de données manquantes
- : diminution de la précision / puissance car diminution de la taille d’échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

En quoi consiste l’indicateur de données manquantes ?

A

Ajouter un niveau de valeurs qui incluent toutes les données manquantes
Applicables pour des données MCAR ou MAR
+ : amélioration de la précision car même taille d’échantillon, diminution du risque de biais

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

En quoi consiste une imputation simple ?

A

Remplacement des données manquantes par des données simulées
Applicables pour des données MAR
1. Dernière observation : remplacement par la valeur mesurée lors de la dernière observation
2. Par la moyenne : remplacement par la moyennes des mesures (inapplicable pour des variables qualitatives + sous-estimation de la variabilité)
3. Par régression : prédiction des valeurs à partir d’un modèle de régression
Y = β₀ + β₁X₁ + e où e est associé aux résidus aléatoires

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

En quoi consiste l’imputation multiple ?

A

Simulation de plusieurs valeurs pour remplacer une donnée manquante par régression puis combinaison des résultats des analyses multiples
+ : bcp de précision de la variance des estimés

How well did you know this?
1
Not at all
2
3
4
5
Perfectly