Cours 8 - Introduction aux Base de données Flashcards

1
Q

Données vs Informations vs Connaissances

A

▪ Donnée ≠ Information ≠ Connaissance
❑ Données = matières premières.
❑ Information = données qui ont été traitées ou interprétées
pour les rendre utiles.
❑ Connaissances = Aide à convertir les données en
information, a leurs donner un sens par le biais de notre
savoir, de notre expérience ou de notre apprentissage ou
à travers l’introspection

▪ Rappel:

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Relations entre données, infos,
connaissances et décisions

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Mauvaise qualité des données et des
informations

▪ Effets commerciaux potentiels résultant de
données et d’informations de mauvaise qualité:

A

❑ L’incapacité de suivre les clients à la trace.
❑ La difficulté d’identifier les clients ayant le plus
de valeur pour l’entreprise.
❑ L’incapacité d’identifier les occasions de vente.
❑ Des occasions de revenu perdues provenant de
promotions faites auprès de clients inexistants.
❑ Le coût d’envoi de courrier non livrable.
❑ La difficulté à trouver la provenance des revenus à cause
de factures imprécises.
❑ L’incapacité de construire de bonnes relations avec les
clients.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Données, Informations, Connaissances et
Décisions

  • Des données/informations de qualité peuvent
    améliorer considérablement les probabilités de
    prendre de bonnes décisions.
  • Les bonnes décisions peuvent avoir un impact
    direct sur les performances de l’organisation.
  • On peut dire que…
  • Comment assurer la qualité des données?
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Définitions d’une BD

A

▪ Conceptuellement, « une base de données (BD) est un
classeur électronique spécialisé dont les tiroirs contiennent les
données… » (O’Brien, 2003)

▪ « l’endroit où sont conservés les faits sur divers types d’objets,
d’évènements, de personnes et d’endroits »

  • Une BD contient aussi des données sur les données: « les
    métadonnées »

L’ensemble des métadonnées constitue le « dictionnaire
de données ».

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

BD =

A

un regroupement de données
structuré/organisé de façon logique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

BD
Les structures/organisations possibles:

A

❑ Hiérarchiques
❑ Réseaux
❑ Relationnelles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Exemples d’utilisations de DB à
travers l’organisation

A

Informationnel
Relationnel
Décisionnel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Modèle d’organisation des données :

(1) BD Hiérarchique (années 70)

  • Structure arborescente
  • Désavantages:
A
  • Nouveau “parent” doit être ajouté avant d’ajouter un nœud “enfant”
    – Ex. Un parent Reptile doit être créé avant d’ajouter Serpent
  • Pas de possibilité de relation entre les nœuds “enfants”
  • Structure rigide, maintenance ardue
    * Comme « concepteur », il fallait être parfois créatif pour représenter certaines situations
    avec cette structure…
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Exemple BD hiérarchique…

Un désavantage ici: Avant d’ajouter un prof (ou un étudiant) dans cette base
de données, il faut que le cours et que le groupe spécifique existe déjà

Un autre… la duplication. Un enfant nœud peut avoir qu’un parent donc les
données pour un même prof (et un même étudiant) doivent souvent être
répétées (par ex., voir les données sur l’enseignant)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Modèle d’organisation des données :

(2) BD Réseau (années 70 et 80)

A
  • Structure qui facilite la représentation des relations plusieurs à plusieurs
  • Un cours peut avoir plusieurs étudiants, un étudiant peut prendre plusieurs cours.
  • Plus souple que la hiérarchique… permet de réduire la duplication
  • Chaque nœud “enfant” peut posséder plus qu’un nœud “parent”
  • Bien que populaire pendant quelques années… fût remplacer par les BD
    relationnelles
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Modèle d’organisation des données :

(3) - BD Relationnelle

A

▪ Les données sont organisées en tables (2 dimensions) qui sont inter-reliés
ensemble à l’aide de relations
▪ Structure très flexible et adaptable à plusieurs situations.
▪ Structure qui facilite les requêtes… par exemple…
❑ Quel est le prix du produit acheté par Jean Bouchard?
❑ Dans quelles villes résident les clients qui ont acheté notre table 2X5?
▪ Ce qu’on fait visuellement pour répondre à ces requêtes, l’ordinateur fait très
rapidement même avec des tables qui contiennent des centaines ou des milliers
de produits, d’achats et de clients

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Questionner la BD : Les Requêtes

A

▪ SQL (Structured Query Language):

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

SGBD (tel que MS-Access)

A

▪ Le contenu des BD est géré au moyen d’un système
de gestion de bases de données (SGBD)

▪ Le SGBD supporte la conception, la mise en œuvre,
et l’exploitation d’une BD. Il assure aussi l’intégrité
des données, gère le partage, le contrôle d’accès et
la sécurité d’une BD

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Types de BD:

A

Individuelles (personnelles)
Organisationnelles
Commerciales
Architecture
Distribuées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Types de BD: Individuelles (personnelles)
AVANTAGES ET INCONVENIENTS

A

▪ Les données et les logiciels qui y accèdent
résident sur un même ordinateur

▪ Avantages :
❑ Faible coût
❑ Facilité de mise en œuvre (pour les cas simples)

▪ Inconvénients :
❑ Difficulté de partage des données
❑ Risque de duplication des données
❑ Risque de perte de données
▪ Ex.: Access de Microsoft, Base de OpenOffice

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Types de BD: organisationnelles
AVANTAGES ET INCONVENIENTS

A

▪ Données résidants sur un serveur commun
▪ Application exécutée depuis un poste de travail

▪ Avantages :
❑ Résout le problème de partage de données et le risque de
redondance
❑ Mécanisme centralisé de sauvegarde et de récupération

▪ Inconvénients :
❑ Gestion plus complexe des accès aux données (sécurité,
gestion de la concurrence)
❑ Nécessite du personnel qualifié ($$$)
* p.ex. Administrateur de base de données
▪ Ex.: MySQL, SQL Server de Microsoft, IBM DB2, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

BD Organisationnelles (suite):

BD de production / BD d’aide à la décision
Les bases de données sont au cœur des systèmes d’information des
entreprises:
* Pour supporter les opérations de l’entreprise:

A
  • « Bases de données de production »
    • Vente et distribution
    • Gestion des stocks
    • Gestion de la production
    • Contrôle de gestion, finance, etc.

*« BD pour l’aide à la décision »: Bases de données d’aide à la
décision : les entrepôts de données (anglais: data warehouses)
*Contiennent non seulement les données de la compagnie mais aussi un recueil
de données provenant d’autres sources (ex. BD gouvernementales, données de
nos fournisseurs, BD commerciales)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Types de BD: Commerciales

A

▪ Bases de données payantes utilisées pour fournir de
l’information aux entreprises ou aux individus (BD de AC
Nielson, BD de Dun & Bradstreet, …).
❑ Dans le cas des entreprises, les données provenant des BD
commerciales peuvent souvent être intégrées à leur entrepôt de
données pour faciliter l’aide à la décision.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Types de BD - Architecture

A

BD externes:
- BD de production (partenaires, clients, fournisseurs)
- BD d’aide à la décision (partenaires, clients, fournisseurs)
- ou BD commerciale (tierce partie)
Entreprise

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Types de BD: Distribuées

A

▪ BlockChain = Une base de données distribuée et
publique

❑ C’est comme un livre de compte ouvert (accessible à tous) où
chaque page est un bloc de transactions

❑ Les transactions y sont enregistrées en permanence et donc
peuvent être vérifiée par ses membres.

❑ Permet de se faire confiance pour des échanges commerciaux
sans avoir besoin d’un intermédiaire
* Promet d’importants changements dans le domaine bancaire, légal,
financier (e.g., Bitcoin), etc.

22
Q

Base de données Relationnelles:

Concepts et Intégrité

A

Concepts – BD Relationnelles
* Une BD contient des données sur les données: « les
métadonnées »
▪ L’ensemble des métadonnées constitue le « dictionnaire
de données ».

23
Q

Concepts – BD Relationnelles

A
24
Q

Clé primaire

  • Pour chaque table, il nous faut une clé primaire (CP). La clé primaire
    permet d’identifier une ligne (un enregistrement) de façon unique
A

– les valeurs d’une clé primaire doivent être uniques et non-nulles (ne peuvent
pas être vides)

– On souligne la clé primaire pour l’identifier

25
Q

Intégrité des entités

▪ Intégrité des entités: Règle qui dit que les valeurs de la
clé primaire d’une table doivent toutes être uniques et
non nulles.

A
26
Q

Choisir une Clé primaire - Exercice

▪ Quelle serait une bonne clé primaire (CP) pour une table
ETUDIANT?
▪ Est-ce que le « numéro d’assurance sociale » serait une
bonne CP pour une table ETUDIANT? Théoriquement?
En pratique?
▪ Quelle serait une bonne CP pour une table COURS?
▪ Une bonne CP pour une table VEHICULE serait?

A
27
Q

Clé primaire composée

A
  • Il arrive parfois qu’il faut combiner des attributs ensemble pour
    créer une bonne clé primaire.

– Rappel: Il faut que la CP soit unique et non-nulle

  • La combinaison de valeurs dans la CP composée doit être
    unique mais chaque morceau de la CP composée n’est pas
    nécessairement unique.
28
Q

Clé étrangère

A

Clé étrangère (CE):
▪ C’est un attribut qui logiquement n’appartient pas à une
table (n’est pas une caractéristique de l’entité) mais est
utilisé pour faire un lien avec une autre table.

▪ La CE est la clé primaire d’une autre table

29
Q

Clé étrangère et Intégrité référentielle
Important: les clés étrangères doivent satisfaire le critère de l’intégrité
référentielle:

A

❑ Les valeurs qui apparaissent sous la clé étrangère doivent déjà
exister dans la table où le champ (attribut) est clé primaire.

❑ Cependant, les valeurs sous une clé étrangère ne sont pas
nécessairement uniques

30
Q

Exemple: Intégrité référentielle

A
31
Q

Sommaire: Intégrités à respecter dans
les BD

2 intégrités à respecter dans les BD

A
32
Q

Le diagramme entité-relation (E-R),
appelé aussi entité-association, est un…

A

modèle conceptuel qui représente les
entités et illustre aussi les types de
relations qui existent entre ces entités
selon les règles administratives.

33
Q

Entité:

A

Sert à représenter un ensemble d’objets sur
lesquels on désire conserver des données:

Exemples: étudiants, cours, produits, clients,
plaintes, commandes, fournisseurs, entrepôts,

34
Q

Relation:

A

Sert à décrire les relations d’affaires entre les
entités

Exemple: achète, loue, fait, …

Une relation est représentée par un lozenge (ou un cercle), le
verbe (ou phrase) à l’intérieur décrit la relation:

Nomenclature: Essayer de décrire une relation avec un verbe (actif
ou passif) qui décrit bien cette relation. L’écrire en minuscule.

35
Q

Exemples

A
36
Q

Les types de relations sont indiqués par des caractères :
Il existe 3 types de relations:

A
  • Relation 1 à 1
  • Relation 1 à N (un à plusieurs)
  • Relation N à M (plusieurs à plusieurs)
37
Q
  • Relation 1 à 1
A
38
Q

Relation 1 à N (un à plusieurs)

A
39
Q
  • Relation N à M (plusieurs à plusieurs)
A
40
Q

Exemple…

A
41
Q

Transformer le DER en Schéma Relationnel
▪ Règles de conversion…

A
42
Q

Exemple

A
43
Q

Petit quiz…

A
44
Q

Soit le problème suivant:
▪ Le propriétaire d’une école de Tango veut conserver les
données de leurs étudiants. On veut aussi savoir dans quels
cours sont inscrits les étudiants. On peut catégoriser un
cours sous l’une des 3 catégories suivantes: intensif,
régulier ou léger. Les prix des cours varient selon la
catégorie. On veut aussi conserver les données sur les
différents professeurs de danse de l’école. Hypothèse: les
professeurs peuvent se partager l’enseignement des cours.

▪Pour concevoir la BD on vous demande de préparer un
diagramme E-R et le schéma relationnel qui en résulte en
respectant la nomenclature apprise dans le cadre du cours
MET1100.

A
45
Q

La normalisation…

A

▪ Inclue des règles ou critères qu’il faut respecter lors de
la conception d’une BD relationnelle.

▪ Principalement, on cherche à réduire la redondance des
données.

▪ Typiquement, le résultat de la normalisation est qu’une
‘grosse’ table sera divisée en deux ou plus tables de
plus petite taille (ceci sert à réduire la
duplication/redondance des données).

▪ Dans le cadre du cours nous cherchons à concevoir des
BD avec des tables en 3ème forme normale (3FN)

46
Q

Les Formes Normales

A

1ere forme normale : Enlever les groupes « non
atomiques »

2eme forme normal : Enlever les dépendances
partielles

3eme forme normale: Enlever les dépendances
transitives

47
Q

A quoi sert la Normalisation?

A

À réduire la redondance (répétition) des
données

48
Q

Considérez une solution à “une grosse table”
(en 1FN)

A

Nous avons retiré les
dépendances partielles et
donc voici notre solution en
2FN. Cette solution requière
seulement…
701 caractères * 8 = 5608
bits car on a réduit la
redondance des données.
Rappel: Grande table =
9776 bits.
Cette solution est aussi en
3FN car il n’y a pas de
dépendances transitives.

49
Q

Résumé de la normalisation…

A

▪ La normalisation réduit la duplication (redondance) des
données… donc ça prend moins de place sur notre
disque dure et en mémoire RAM…

▪ Par contre, la normalisation typiquement augmente le
nombre de tables. Avoir beaucoup de tables ralenti
souvent les requêtes car Access doit sauter d’une table
à une autre pour trouver les informations.

50
Q

Normalisation Vs. Dé-normalisation

A

▪ Parfois, il est nécessaire de dé-normaliser une BD pour
augmenter sa performance (réduire le temps d’exécution
des requêtes… réduire le temps de lecture de la BD )

❑ Normalisation = DB plus petites (moins de redondances de
données) mais plus de tables. Maintenance plus facile.

❑ Dé-normalisation = on cherche à augmenter la vitesse
d’exécution des requêtes (mais maintenance plus complexe)