1 - Intro Flashcards

1
Q

Qu’est-ce que la science des données et quels sont les principaux secteurs qui en font partie pour couvrir le cycle de vie d’une problématique ?

A

La science des données analyse de grands volumes de données via l’informatique, les statistiques et l’IA.

Principaux secteurs du cycle de vie des données :

  • Collecte
  • Nettoyage
  • Analyse
  • Modélisation
  • Interprétation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quelles sont les principales étapes du cycle de vie de la science des données et quel est leur rôle dans la résolution d’une problématique ?

A

Le cycle de vie de la science des données comprend :

  1. Détermination des requis – Identification des problématiques avec le client.
  2. Minage (Data Mining) – Regroupement des sources de données pertinentes.
  3. Filtrage (Data Cleaning) – Nettoyage des données (valeurs incongrues, manquantes, extrêmes).
  4. Exploration (Data Exploration) – Analyse avec statistiques et apprentissage machine.
  5. Visualisation – Présentation des résultats pour faciliter la prise de décision.

Ces étapes permettent d’exploiter efficacement les données pour obtenir des insights pertinents.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quel est le rôle d’un scientifique des données (Data Scientist) et comment son travail a-t-il évolué avec le temps ?

A

Réponse :
Le Data Scientist analyse les données, identifie leurs sources et collabore à la visualisation des résultats.

Évolution du rôle :
Avec le temps, son travail s’est spécialisé en :
- Data Engineer – Gestion et structuration des données.
- Data Analyst – Analyse et interprétation des données.
- Data Architect – Conception des infrastructures de données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quel est le rôle d’un administrateur de base de données (DBA) en science des données ?

A

Réponse :
Le DBA gère les bases de données essentielles à la collecte et à la sauvegarde des données structurées.

Responsabilités :
- Conception des bases de données.
- Entretien et optimisation des performances.
- Assurer le bon fonctionnement pour l’analyse des données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelles sont les responsabilités d’un ingénieur en apprentissage machine (Machine Learning Engineer) ?

A

Réponse :
Le Machine Learning Engineer développe des modèles d’apprentissage automatique pour analyser les tendances et faire des prédictions.

Responsabilités :
- Collaborer avec les Data Scientists.
- Développer et optimiser des modèles d’IA.
- Automatiser les processus de prise de décision.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Pourquoi est-il important pour une organisation de sauvegarder des données de manière semi-permanente ?

A

Réponse :
La sauvegarde semi-permanente permet de conserver l’historique des données pour :

  • Faciliter la prise de décisions éclairées.
  • Améliorer la gestion des opérations.
  • Garantir l’accès aux informations pour des analyses futures.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quels systèmes de données simples sont utilisés pour stocker des informations de manière temporaire ou pour des besoins spécifiques ?

A

Réponse :
Les fichiers texte et classeurs Excel sont utilisés pour stocker temporairement des données ou répondre à des besoins spécifiques.

Limites :
- Peu adaptés à la gestion de grands volumes de données.
- Manquent de structuration et de sécurité avancée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quels problèmes typiques sont résolus par les systèmes de gestion de bases de données ?

A

Réponse :
Les SGBD résolvent plusieurs problèmes, notamment :

  • Duplication des données.
  • Conflits entre données contradictoires.
  • Mise à jour cohérente sur tout le système.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quels sont les avantages et inconvénients des bases de données relationnelles (SQL) ?

A

Réponse :
Avantages des bases de données relationnelles (SQL) :
- Structure claire basée sur des tables.
- Relations entre tables pour éviter la duplication et faciliter la segmentation.

Inconvénients :
- Moins efficaces pour gérer des données non structurées.
- Moins performantes pour de très grands volumes de données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

En quoi les bases de données relationnelles sont-elles structurées ?

A

Réponse :
Les bases de données relationnelles sont structurées autour de tables, avec :
- Colonnes représentant différents types d’informations.
- Lignes représentant des enregistrements spécifiques avec des valeurs correspondant aux colonnes.

Cela permet une organisation claire et une segmentation des données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Comment interagit-on avec une base de données relationnelle ?

A

Réponse :
On interagit avec une base de données relationnelle en utilisant SQL (Structured Query Language) pour :
- Sélectionner,
- Insérer,
- Mettre à jour,
- Supprimer des données dans les tables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce qu’un Système de Gestion de Base de Données Relationnel (RDBMS) ?

A

Réponse :
Un Système de Gestion de Base de Données Relationnel (RDBMS) est un logiciel qui :
- Gère l’organisation, l’accès et la manipulation des bases de données relationnelles.
- Fournit des outils pour définir, interroger et maintenir les bases de données.
- Garantit la cohérence et la sécurité des données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quel est le type fondamental de données en informatique, et quelles sont ses valeurs possibles ?

A

Réponse :
Le type fondamental de données en informatique est le binaire, avec deux valeurs possibles :
- 0
- 1

Ces valeurs sont utilisées pour représenter d’autres types de données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce qu’une valeur booléenne et comment est-elle liée au type binaire ?

A

Réponse :
Une valeur booléenne est une valeur qui peut être soit Vrai (1), soit Faux (0). Elle est liée au type binaire, où :
- Vrai = 1
- Faux = 0

La logique booléenne repose sur ce système binaire à deux valeurs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Comment les nombres entiers sont-ils représentés en mémoire et pourquoi utilise-t-on l’hexadécimal ?

A

Réponse :
Les nombres entiers sont représentés en mémoire sous forme de valeurs binaires.

L’hexadécimal (base 16) est utilisé pour :
- Faciliter la gestion des nombres en mémoire.
- Être plus compact et facile à manipuler que la représentation binaire directe (base 2).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Comment peut-on représenter des nombres entiers négatifs en informatique ?

A

Réponse :
Les nombres entiers négatifs sont représentés en informatique par des techniques comme le Complément de deux, qui permet :
- De gérer les signes des nombres.
- De simplifier les opérations arithmétiques.

17
Q

Pourquoi est-il plus difficile de sauvegarder des nombres fractionnaires (réels) en informatique ?

A

Réponse :
Il est difficile de sauvegarder des nombres fractionnaires (réels) en informatique car :
- Ils nécessitent des techniques spécialisées, comme la représentation scientifique (par exemple, 1.237x10^12), séparant le signe, l’exposant et la partie significative.
- Certains nombres réels ne peuvent pas être représentés exactement en mémoire, entraînant des problèmes de précision.

18
Q

Comment le texte est-il représenté en informatique et pourquoi faut-il une conversion ?

A

Réponse :
Le texte est représenté en informatique sous forme binaire. La conversion est nécessaire pour :
- Traduire les caractères en valeurs numériques.
- Utiliser des tables de traduction comme ASCII (pour les caractères simples) et Unicode (pour tous les caractères, y compris les émojis).

19
Q

Quelle table est couramment utilisée pour représenter des caractères simples en informatique ?

A

Réponse :
La table ASCII est couramment utilisée pour représenter des caractères simples en informatique. Elle attribue un numéro à chaque caractère pour les convertir en valeurs binaires.

20
Q

Quelle norme permet de représenter l’ensemble des caractères humains, y compris les émojis ?

A

Réponse :
La norme Unicode permet de représenter l’ensemble des caractères humains, y compris les émojis, offrant une couverture plus large que la table ASCII.

21
Q

Que sont les chaînes de caractères (String) en informatique ?

A

Réponse :
Les chaînes de caractères (String) en informatique sont des suites de caractères utilisées pour représenter des informations textuelles, telles que des phrases ou des mots.

22
Q

Pourquoi avons-nous besoin de données structurées et qu’est-ce qu’elles permettent de faire ?

A

Réponse :
Les données structurées permettent de :
- Regrouper plusieurs éléments de types différents pour mieux aborder une problématique.
- Organiser les données de manière logique, facilitant leur gestion et leur analyse.

23
Q

Qu’est-ce qu’une liste (list, array, sequence) en informatique ?

A

Réponse :
Une liste (ou array, sequence) est un regroupement de valeurs, généralement du même type, organisées dans un ordre numérique. On accède aux éléments d’une liste en utilisant leur position (indice) dans la séquence.

24
Q

Comment fonctionne un enregistrement (record, tuple, struct) ?

A

Réponse :
Un enregistrement (ou tuple, struct) est un regroupement d’éléments qui peuvent être de types différents. C’est une structure courante dans les bases de données, où chaque ligne d’information correspond à un enregistrement.

25
Q

Où trouve-t-on couramment des enregistrements en informatique ?

A

Réponse :
Les enregistrements sont couramment utilisés dans les bases de données, où chaque ligne représente un enregistrement regroupant des données de types différents.