Data Science Flashcards
Définir un bit
Plus petite unité de donnée dans un système d’information classique. Prend 2 états : I ou 0
Définir un byte
Un byte (ou octet) est un ensemble de 8 bits
Citer les 3 fonctions (ou états) de l’information
Traitement, Stockage, Transport.
Définir la donnée structurée et donner des exemples
La donnée structurée est une donnée dont la structure porte de l’information : booléenne, entier, flotant,…
Définir la donnée non-structurée
Une donnée sans structure, plus lourde, qui a besoin de contexte pour prendre son sens : tweet, image,…
Définir une base de donnée
Une façon de stocker des données homogènes et de les relier entre elles
Qu’est-ce qu’une base de données relationnelle ?
Une BDD relationnelle se représente par des tableaux et stockent des données structurées
Qu’est-ce qu’une base de données non-relationnelles ?
Une collection de données non-structurées mais homogènes
Quelle quantité de données a été créée jusqu’en 2020 ?
40 Zo dépassés en 2020
En combien d’années ont été crées 90% des données existantes ?
2 ans
Qu’est-ce que l’approche 3V de Russom ?
High Volume, High Velocity, High Variety
A quand remonte la naissance des statistiques descriptives ?
La préhistoire (2300 AEC)
Qu’est-ce que le Web 2.0 ?
Web participatif, version évoluée du web vers plus d’interaction (2004)
Qui a inventé le terme Big Data ?
Robert Mougalas
En quelle année Yahoo! lance Hadoop ?
2005
Citer les 3 besoins d’analyses de big data
- L’analyse descriptive (what happened)
- L’analyse prédictive (what will happen)
- L’analyse prescriptive (how to make it happen)
Définir un data warehouse
Un data warehouse est un ensemble de bases de données relationnelles conçu pour maximiser l’exactitude et l’accès à la donnée
Comment est organisé un data warehouse ?
Sémantiquement, par sujet
A quoi sert un ETL ?
Extraire, vérifier, transformer, harmoniser et charger la donnée
(Extract, Transform, Load)
Qu’est-ce qu’un data mart ?
Un sous-ensemble (virtuel ou répliqué) du data warehouse qui organise la donnée par usage et alimente les outils de BI
Quelle technique permet de stocker physiquement un volume de donnée croissant ?
Le scaling
Quelles sont les 5 étapes du Data Science Process ?
- Ask a question
- Get the data
- Explore the data
- Model the data
- Communicate