4 - Le management stratégique des données Flashcards
Le big data
Le big data ou mégadonnées correspond aux vastes quantités de données disponibles, nécessitant des traitements massifs.
Les 7 V
-Volume
-Vélocité
-Variété
-Valeur
-Visualisation
-Véracité
-Variabilité
Données Structurées
Format organisé et facile à rechercher (exemples : tableaux Excel, bases de données SQL, listes de clients avec des informations spécifiques comme l’âge, l’adresse, etc.).
Données Non Structurées
Format irrégulier et difficile à analyser automatiquement (exemples : emails, vidéos, publications sur les réseaux sociaux, transcriptions de conversations).
Data lake
Les données structurées et non structurées forment un data lake.
Un data lake est un vaste réservoir de stockage qui permet de conserver de grandes quantités de données brutes dans leur format d’origine.
Data warehouse
Un data warehouse est une grande base de données centralisée utilisée pour stocker, organiser et analyser de grandes quantités de données structurées provenant de différentes sources.
Datamart
Un datamart est une sous-section d’un data warehouse, conçue pour un département spécifique ou un type de données.
Différence entre data lake et data warehouse
Un data lake stocke de grandes quantités de données brutes, structurées ou non, tandis qu’un data warehouse contient des données structurées et organisées pour une analyse facile.
Différence entre data warehouse et datamart
Un data warehouse stocke des données structurées de toute l’entreprise, tandis qu’un datamart contient des données liées à un domaine spécifique.