Exam 12/11/2021 Flashcards

1
Q

6 étapes de démarche pour améliorer la qualité des données (DEAAIC)

A
Définition,
Évaluation,
Analyse,
Amélioration,
Implémentation, 
Contrôle
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

3 Types de structuration de données

A

Struc. : données relationnelles
Semi-Struc. : struc. flexible (XML)
Non-Struc. : langage naturel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

4 Types “secondaires” de classification de données

A

Élémentaires : âge, s*xe, …
Agrégées : obtenus par agrégation (revenu annuel)
Fédérées : de sourcés hétérogènes
Web : du web + temporelles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

précision syntaxique

A

Nombre de modif qu’il faut pour avoir la bonne valeur (ex Didir -> Didier => 1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Complétude

A

Vérifie l’ampleur, profondeur et portée (APP) de données pour vérifier si suffiant pour accomplir la tâche

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Complétude de schéma

A

degré auquel les concepts et leurs propriétés manquent du schéma

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Complétude de colonne

A

Mesure des valeurs manquantes pour une propriété ou une colonne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Complétude de population

A

Evalue les valeurs manquantes par rapport à une population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Complétude des données relationnelles

A

La présence/absence et le sens des valeur « null »

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Open World Assumption

A

Ce n’est pas parce qu’on ne connaît pas une information que cette information est fausse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Closed World Assumption

A

Ce qui n’est pas vrai est faux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Currency

A

Rapidité avec laquelle les données sont mises à jour

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Volatility

A

Fréquence avec laquelle les données varient (ex: température forte volatility)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Timeliness

A

Si les données du jour arrivent assez vite pour s’en occuper

= MAX(0; 1 - (currency/volatility))

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

5 Activités pour QD (LCNIA)

A

Localisation d’erreurs : mise en place de règles et regarder quel tuple ne les suit pas

Correction d’erreur : corriger les erreurs suite à la mise en place de règles

Normalisation : suivre une norme définie pour les données

Identification objet : <=> déduplication

Activité : traitement d’anomalies rares

How well did you know this?
1
Not at all
2
3
4
5
Perfectly