Hoofdstuk 1 Flashcards
Definities en termelogieën
wat kan je met datamining?
- zoeken naar correlaties tussen verschillende producten op basis van kassabongegevens (fietsenwinkel biedon en biedonhouder)
- patronen in gegevens herkennen (schadeverzekering die minder mensen in dienst hoeft te nemen door patronen in gegevens herkent te hebben
voordelen datawarehouse
- historie kan bijgehouden worden
- kwaliteit gegevens wordt beter gecontroleerd
- gegevens uit verschillende bronnen kunnen worden gecorreleerd
- performance kan doelgericht opgezet worden voor rapporteren en analyseren
- rapportages komen vanuit één bron wat de eenduidigheid ervan bevorderd
staging database
een database waarin gegevens tijdelijkworden opgeslagen tijdens het ETL-proces alvorens ze worden overgehaald naar een datawarehouse
semantisch model
een abstractielaag in een kubus die technische database gegevens vertaalt voor de eindgebruiker door:
- betekenis geeft aan gegevens
- verbanden legt tussen gegevens
- jargon van de organisatie toepast
Rapportdatabase
een ODS waar direct rapportages uit worden gehaald
ODS
- ODS (operational data store)
- eerste plek waar gegevens komen na de staging database.
- het dient als een tussenstop (2e staging) of als een rapportdatabase
kubus
een soort database waarin semantische modellen staan
ander woord voor kubus is meerdimensionele draaitabel
Doel ETL
Door gegevens aan te passen en te correleren wordt de kwaliteit gewaarborgd van de gegevens in het datawarehouse, rapportages en analyses
Definitie ETL-proces
ETL:
Extract: gegevens uit bronnen halen
Transform: gegevens aanpassen aan eisen datawarehouse
Load: gegevens laden in datawarehouse
Proces van gegevens uit bronsystemen halen en inlezen in datawarehouse
datawarehouse (incl. doel)
- is een centrale database gevld met gegevens uit één of meer aparte bronnen
- met als doel het maken van rapportages en het doen van data-analyses.
datamining
- het gericht zoeken naar (statistische) verbanden in gegevensverzamelingen
- met als doel profielen op te stellen voor wetenschappelijk of commercieel gebruik
datamarts
is een deelverzameling van een datawarehouse die specifiek voor een deelgebied van de te maken rapportages wordt gemaakt.
of
kleine datawarehousjes , gemaakt voor specifieke rapport- en analysedoeleinden.
Business intelligence (definitie incl. doel)
- Iedereen in de organisatie
- op het juiste moment
- de juiste informatie
- in het juiste formaat te voorzien
- met als doel een competitief voordeel te behalen door betere besluitvorming.
is een paraplu term voor rapporten bouwen tot big data, van ods tot kubussen en dataming etc.
Big data
refereert aan datasets waarbij
- de hoeveelheid aan gegevens
- de snelheid waarmee die verwerkt moeten worden
- en/of hun diversiteit
een probleem worden als gegevens op een klassieke manier worden behandeld (een gewone datawarehouse)
self service bi
draait om het in staat stellen van eindgebruikers om zelf in hun informatiebehoefte te voorzien zonder andere te vragen oplossingen voor ze te bouwen ten einde de juiste informatie op het juiste moment ter beschikking te hebben