Syllabus Flashcards
Business intelligence
- Application logiciel qui collecte et traite une grande quantités de données.
- Permet d’extraire, transformer et charger les données dans un nouvelle environnement.
- Les données sont representés sous forme de tableau de bords interactif permettant aux utilisateurs de faire des analyses dynamiques et de prendre de décisions plus éclairés.
- Répond à la question : Quels sont le performances actuelles et passées de mon entreprise ?
- BI s’applique aux données structurées ou semi-structurées, provenant principalement de bases de données relationnelles.
Data science
- Domaine interdisciplinaire combinant les mathématiques, les statistiques, la programmation spécialisés, le deep learning, le machine learning pour extraire les informations afin de guider la prise de décisions et la planification stratégiques
- Le data science peut être decriptive, prescriptive ou predictive.
- S’applique aux données structurées, semi-structurées et non structurées
- Inclut des informations provenant de bases de données relationnelles et non relationnelles.
Quels sont les 3 types de données ?
- Données structurées
- Données semi structurées
- Données non structurées
Il existe quatre types d’échelles pour mesurer une variable :
- Nominal
- Ordinal
- Interval
- Proportionnelle
Qu’est ce qu’une variable nominal ?
- Une variable nominal est une vairable qualitatif mais ne pas pas être classé sous un ordre logique / hiérarchique.
- Par exemple, on ne peut pas dire que jaune > rouge, ni inversemement.
Qu’est ce qu’une variable ordinal ?
- Une variable ordinal est une variable qualitatif qui peut être classé sous un certain ordre logique.
- Par exemple, Bonne note > moyenne note > mauvaise note
Qu’est ce qu’une variable interval ?
- Une variable interval est une variable quantitatif dont les intervalles entres les valeurs ne sont pas constantes.
- Exemple: mesure de la temperature - 12/15/2022 13:45:34 7.2 C°; 12/15/2022 13:46:15 7.1C°; 12/15/2022 13:52:55 7.4 C°.
Qu’est ce qu’une variable proportionnelle ?
- Une variable quantitative proportionnelle contient des valeurs qui sont caractérisées par des proportions égales entre les valeurs mesurées, de sorte qu’un calcul mathématique direct et constant est possible.
- Exemple : une personne pesant 90 kg est deux fois plus lourde qu’une personne pesant 45 kg.
Quel est la différence entre variable discrète et continus ?
- Une variable continue a un nombre infini ou indéfini de valeurs. Il s’agit de données dont les valeurs appartiennent à un sous-ensemble infini de l’ensemble R. Par exemple, si la température est comprise entre 10 et 12°C, la variable peut prendre l’une des innombrables valeurs existantes et mesurables : 10,007°C, 11,11°C ou 11,9999°. Exception lorsque l’ensemble des valeurs est grand. Par exemple, l’âge : ce n’est pas un nombre infini, mais nous avons plusieurs dizaines de valeurs. La variable est donc considérée comme continue.
- Une variable discrète a un nombre fini ou dénombrable de valeurs. Exemple : niveau d’éducation, Primaire, secondaire, supérieur, universitaire… Mais il peut aussi s’agir d’une variable quantitative si elle ne prend que des valeurs isolées. Par exemple, un âge, une note arrondie à 0,5, etc. Les variables binaires sont un cas particulier d’attributs discrets.
La différence entre une base de données relationnelle et une base de données non relationnelle ?
- La différence est le stockage de l’information (stockage sous forme de table ou de clé/valeur).
- Bien que NoSQL réponds aux problèmes actuels du Big Data, il ne remplace pas la base de données relationnelle, mais la complète. Les données sont en effet regroupées dans un second temps pour être analysées.
Une base de données contient les données de
- Computer application
- ERP
- API (application promgramming interface)
- A data lake
- Site web, réseau sociaux
Qu’est ce qu’un API ?
- Solution permettant d’accéder à distance aux fonctions ou aux données d’une application.
- Une requête est envoyée au logiciel cible dans un langage universel qui effectue les actions et délivre le contenu demandé.
- Grâce à une API, les applications peuvent communiquer entre elles et échanger des services ou des données.
Qu’est ce que data lake ?
- Réservoir de données brute qui alimente un processus décisonnelle.
- Contrairement a la base de données, les données de data lake ne sont pas modélisées.
Data warehouse, entrepôt de données ?
- Base de données et ses outils qiu sont collecter et stockées dans un entrepôt de données qui regroupes et stocke les données actuelles et historiques.
- Les données proviennent de plusieurs système opérationnelle et de source externe, chacun avec des modèles de données différents
- Les données peuvent être consultés mais pas modifiés.
Qu’est ce qu’un star shema ?
- Utilisé pour organiser les données dans le datawarehouse, en particulier, pour la couche dataamart.
- Caractérisé par un table de fait et une table dimensions.
Le but d’un star schéma ?
Limiter le nombre de jointure afin d’accélerer l’analyse des données lorsque les utilisateurs font des requêtes dans les différentes vues.