Recente en nieuwe technologieën Flashcards
Wat zijn de beperkingen/uitdagingen van Blockchain?
Criminaliteit
Duurzaamheid
Schaalbaarheid
Technische moeilijkheden
Wat is Business Intelligence?
BI is gericht op het verwerken, analyseren en opslaan van grote dataverzamelingen uit heterogene bronnen.
Ook geautomatiseerde verzameling van gegevens (zoals IoT).
Vergelijkbaar met DIKAR maar meer geavanceerd.
Opvolger van DSS (Decision Support Systemen).
Wat is Big Data?
Big Data richt zich op specifieke vereisten zoals het combineren van meerdere niet-gerelateerde datasets, het verwerken van grote hoeveelheden data en het zoeken van informatie, ofwel in batch processing, ofwel in stream processing.
Wat is Batch Processing?
informatie is pas beschikbaar na enige tijd.
Wat is Stream Processing?
informatie is meteen beschikbaar. real-time
Hoe verloopt het Business Intelligence proces?
Loop/iteratief:
Business problemen leiden naar
Data Management
Descriptive Analytics (wat is er gebeurd)
Predictive Analytics (wat kan er gebeuren)
Prescriptive Analytics (wat zouden we moeten doen)
die leiden naar beslissen en dan terug naar Data Management of Descriptive Analytics
Wat is een Data Warehouse? Hoe geraakt de data daar?
Ter beschikking stellen van data zodanig dat die geanalyseerd kan worden los van de operationele databanken (meestal TPS). Beter voor performantie TPS.
Kopiëren naar Data Warehouse = ETL = extraction, transformation and load = Data Management
Waaruit bestaat extraction binnen ETL naar Data Warehouse?
technische integratie vanuit (relationele of andere operationele) databanken.
Inclusief foutcontroles, rechtzettingen of stoppen met kopiëren.
Waaruit bestaat transformation binnen ETL naar Data Warehouse?
Data converteren (vb: alles naar dollar) Aggregeren (vb: enkel verkopen per week bijhouden)
Waaruit bestaat load binnen ETL naar Data Warehouse?
Het kopiëren van de getransformeerde data naar Data Warehouse.
Frequentie bepaalt hoe actueel de data is. Vaak op momenten met weinig performantievereisten.
Wat is Descriptive Analytics? Welke verwerkingen kennen we?
Wat in het verleden gebeurd is.
Verschillende verwerkingen mogelijk:
- OLAP (OnLine Analytical Processing)
- Data Mining
Wat is OLAP? Wat zijn veel gebruikte technieken?
Online Analytical Data Mining.
Voorbeeld van Descriptive Analytics in Business Intelligence Process.
Interactief grote hoeveelheid data vanuit verschillende perspectieven ondervragen. (product, tijd, geografisch gebied)
Interactief: real-time en ad-hoc.
- Consolidatie: aggregatie
- Drill-Down: desagreggeren op een bepaald perspectief.
- Slicing and Dicing: analyses vanuit verschillende perspectieven.
Wat is Predictive Analytics?
Toekomst voorspellen. (incl. fraudedetectie en faillissementen voorspellen)
vb: Predictive Maintenance
Denk aan Data Mining en Recommender Systems.
Wat is Predictive Maintenance?
Voorbeeld van Predictive Analytics.
Voorspellen wanneer onderhoud nodig is (vb: wagen) op basis van de werkelijke staat. Is NIET hetzelfde als Preventive Maintenance waarbij rekening gehouden wordt met de verwachte staat van het toestel.
Wat is Data Mining? Welke technieken kennen we?
Graven in grote datasets om verbanden te vinden.
- classification and class probability estimation: klassen
- regression: waarde voorspellen ipv ja of nee
- similarity matching: samenzetten obv gelijkenissen
- clustering: groeperen zonder specifiek doel (consumenten, KMO, …)
- co-occurence grouping: associaties (welke producten samen verkocht)
- profiling: gedragsbeschrijving
- link detection: (10 gemeenschappelijke vrienden, dus jullie kennen elkaar)
- causal modeling: oorzaak, gevolg