Traitement des données manquantes Flashcards

1
Q

Comment note-on la matrice des données observées? et manquantes?

A

Yobs et Ymis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce que la matrice de réponse R?

A

Une matrice avec des indicatrices. 1 si la valeur est observée et 0 sinon.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quels sont les 3 types de données manquantes?

A

MCAR, MAR et MNAR

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Expliquez ce qu’est le type MCAR.

A

La probabilité de réponse n’a aucun lien avec les données. Dans ce cas, Rij suivra une bernoulli(1 - Theta), où theta : 10% si on perd au hasard 10% des données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Expliquez ce qu’est le type MAR.

A

La probabilité de réponse dépend seulement de variables mesurées dans le jeu de données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Expliquez le type MNAR.

A

La probabilité de réponse dépend de la variable contenant des NA elle-même, donc de Ymis OU elle dépend d’une autre variable non observée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quel test peut-on faire pour vérifier si les données sont MCAR?

A

Un test du khi-carré de pearson avec H0 : les données sont MCAR.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles sont les 7 options de traitement des NA?

A
  1. Cas complets
  2. Cas disponibles
  3. Imputation par la moyenne ou la médiane
  4. Imputation par une régression
  5. Imputation stochastique par une régression
  6. Imputation Hot-Deck
  7. Imputation multiple
How well did you know this?
1
Not at all
2
3
4
5
Perfectly