06 Data Warehousing, OLAP och kuber Flashcards
Vilka olika typer av IS stödjer vilken typ av beslutsnivå? (3+3)
Strategisk nivå
- ledningssystem (Executive Info. System, EIS)
Taktisk nivå
- beslutsstödssystem BSS (Dec. Support System, DSS)
Operationell nivå
- operationella system (administrativa system, ERP-system)
På vilken beslutsnivå används data warehouse och data marts?
Strategisk och taktisk nivå
Vilka problem adresseras med Data Warehouse? (4)
Data som borde finnas kan saknas i de operationella systemen
Data kan finnas felaktig i de operationella systemen
Termer som kund och produkt kan betyda olika saker i de olika operationella system
Ingen enhetlig bild av kund, produkt och andra begrepp utan data om dessa begrepp finns utspridd i olika operationella system
Vad är ett ETL system och vad gör det? (3 + 1)
Ett verktyg/system som designar och utför: ”extract” ”transform” ”load” -aktioner
Kan också kontrollera att data som ska laddas in i DW är korrekt genom att korrigera felaktigheter (”cleansing info”)
Vad är ett data marts?
(dataskafferi)
Kan ses som ett “mini”-DW anpassat att stödja en viss avdelning eller process för enkel och snabb access
Vad är beroende respektive oberoende data marts?
Beroende
- får data från ett DW (“hub and spoke”)
Oberoende
- DW får data från data marts (“data mart bus architecture”)
Vad är ett Business Query and Reporting-verktyg (Rapportdesignverktyg)?
Informationssystem som används av utvecklare eller användare (“power user”) för att skapa användaranpassade rapporter
Vad är ett OLAP-verktyg?
Informationssystem (beslutstödsystem) som möjliggör för användare att utföra multidimensionell analys
- stödjer så kallad interaktiv och “ad-hoc” “querying”, dvs kräver ingen SQL eller annat frågespråk
Vad är ett Visual Data Discovery-verktyg?
Informationssystem som med stödjer interaktion och erbjuder användare visuella medel för att presentera och analysera data samt visa på/föreslå samband/associationer som användaren inte tänkt på
Vad är ett Data mining-verktyg?
Informationssystem som möjliggör för statistiker och skickliga verksamhetsanalytiker att upptäcka mönster i stora datamängder genom att använda olika data mining-algoritmer och modeller
Vilket användargränssnitt används oftast för OLAP-verktyget och vilka funktioner brukar dessa tillhandahålla?
Excel
Drill-down
- (genom att t.ex. dubbelklicka på ”Grupp AB”) – för att få detaljerad information för Grupp A och Grupp B
Lägga till ytterligare kolumner
- dra in kategorier i excel-blad
Hur struktureras data i ett data warehouse (modellering)? (3)
Stjärnschema/dimensionell modellering
- faktatabellen (eller tabellerna) omges av en dimensionstabell per dimension
- denormaliserad
Data vault modellering
- baserad runt modelleringskonstrukterna hubs, links, satellites
- mer flexibel än dimensionell modellering (mer normaliserad)
Anchor modelling
- baserad runt modelleringskonstrukterna anchor, attribute, tie and knot
- mer normaliserad och hanterar förändring bättre
Vilka olika typer av attribut finns i OLAP-gränssnitt? (2)
Dimensioner/perspektiv
- på vilket sätt man tittar på fakta
(multidimensionellt perspektiv)
Fakta/mättal
- värde som man får fram
Vad är MOLAP-teknologi?
Lagrar data i en arraystruktur (kallas ibland för kub) i stället för en relationsdatabas
- möjliggör avancerad multidimensionell indexering för mycket snabb access
(kräver mycket utrymme)
Vad är ROLAP-teknologi?
Bygger på relationsdatabashanteringssystem, aggregerade tabeller, SQL-frågor och extentioner till SQL (Cube, Crossjoin).
Beräkningar sker “on the fly” av databashanteringssystem