Architectures des entrepôts de données Flashcards
Architectures des ED
Architecture client/serveur souvent à trois strates :
- Serveur d’entrepôt (“Warehouse Database Server”). Très souvent un système relationnel
- Serveur OLAP de type ROLAP ou HOLAP
- Client :
– Outils de requêtes et de production de rapports
– Outils d’analyse et de fouille de données
Architecture à deux strates : MOLAP
ROLAP (Relational OLAP) :
- Stocke les données dans des BD relationnelles
- Offre des extensions à SQL et des méthodes d’accès spécialisées
MOLAP (Multidimensional OLAP) :
- Stocke des données dans des structures multidimensionnelles spécialisées (ex. vecteurs)
- Précalcul des résumés statistiques
HOLAP (Hybrid OLAP) :
- Combine les deux technologies ROLAP et MOLAP
- Données détaillées dans les tables relationnelles et agrégations dans une structure multidimensionnelle
Serveurs ROLAP
Caractéristiques :
- Usage de SGBD relationnels (ou relationnels extensibles) pour le stockage et la gestion de l’ED et utilisation de techniques d’indexation élaborées (ex. index bitmap)
- Usage d’un intergiciel OLAP pour les requêtes multidimensionnelles
Trois principaux modèles :
- Étoile
- Flocon de neige
- Galaxie
ROLAP versus MOLAP
Avantages du MOLAP
- Excellentes performances
– Les cubes MOLAP sont construits pour une recherche rapide et l’exécution des opérateurs Slice & Dice
– Les calculs (ex. sous-totaux) sont effectués durant la création du cube et facilitent la production des réponses aux requêtes
Désavantages du MOLAP
- Ne peut construire et manipuler des cubes volumineux
- Nécessite un investissement important pour une organisation
Avantages du ROLAP
- Peut gérer un grand volume de données
- Peut tirer avantage des fonctionnalités des systèmes relationnels
Désavantages du ROLAP
- Performances faibles en présence de requêtes complexes sur des cubes volumineux
- Fonctionnalités limitées de SQL pour certaines opérations OLAP
Domaines d’application des ED
Analyse de ventes et de marketing
Gestion de la clientèle sur l’Internet (CRM)
Rapports financiers et consolidation
Planification et budget
Analyse de profitabilité et de prix
Analyse de qualité
Aide à la prise de décisions en matière de coûts et de ressources humaines
Détection des fraudes et des irrégularités
Analyse de politiques et programmes gouvernementaux
Outils d’entreposage de données
ETL
Épuration de données
Gestion de métadonnées et référentiels
OLAP
Requêtes et génération de rapports
Fouille de données
Visualisation
EIS (Executive Information Systems)
Conclusion de l’architecture des ED
Le marché du BI, y compris celui des ED
- Est toujours en évolution
- Tient compte de plus en plus des données massives
Nouvelles technologies en BD et ED
- MapReduce et Hadoop
- Stockage de données en colonne (column-store)
- Stockage de données en mémoire principale (in-memory)
Plusieurs systèmes à la fine pointe