06 Data Warehousing, OLAP och kuber Flashcards
Vilka olika typer av IS stödjer vilken typ av beslutsnivå? (3+3)
Strategisk nivå
- ledningssystem (Executive Info. System, EIS)
Taktisk nivå
- beslutsstödssystem BSS (Dec. Support System, DSS)
Operationell nivå
- operationella system (administrativa system, ERP-system)
På vilken beslutsnivå används data warehouse och data marts?
Strategisk och taktisk nivå
Vilka problem adresseras med Data Warehouse? (4)
Data som borde finnas kan saknas i de operationella systemen
Data kan finnas felaktig i de operationella systemen
Termer som kund och produkt kan betyda olika saker i de olika operationella system
Ingen enhetlig bild av kund, produkt och andra begrepp utan data om dessa begrepp finns utspridd i olika operationella system
Vad är ett ETL system och vad gör det? (3 + 1)
Ett verktyg/system som designar och utför: ”extract” ”transform” ”load” -aktioner
Kan också kontrollera att data som ska laddas in i DW är korrekt genom att korrigera felaktigheter (”cleansing info”)
Vad är ett data marts?
(dataskafferi)
Kan ses som ett “mini”-DW anpassat att stödja en viss avdelning eller process för enkel och snabb access
Vad är beroende respektive oberoende data marts?
Beroende
- får data från ett DW (“hub and spoke”)
Oberoende
- DW får data från data marts (“data mart bus architecture”)
Vad är ett Business Query and Reporting-verktyg (Rapportdesignverktyg)?
Informationssystem som används av utvecklare eller användare (“power user”) för att skapa användaranpassade rapporter
Vad är ett OLAP-verktyg?
Informationssystem (beslutstödsystem) som möjliggör för användare att utföra multidimensionell analys
- stödjer så kallad interaktiv och “ad-hoc” “querying”, dvs kräver ingen SQL eller annat frågespråk
Vad är ett Visual Data Discovery-verktyg?
Informationssystem som med stödjer interaktion och erbjuder användare visuella medel för att presentera och analysera data samt visa på/föreslå samband/associationer som användaren inte tänkt på
Vad är ett Data mining-verktyg?
Informationssystem som möjliggör för statistiker och skickliga verksamhetsanalytiker att upptäcka mönster i stora datamängder genom att använda olika data mining-algoritmer och modeller
Vilket användargränssnitt används oftast för OLAP-verktyget och vilka funktioner brukar dessa tillhandahålla?
Excel
Drill-down
- (genom att t.ex. dubbelklicka på ”Grupp AB”) – för att få detaljerad information för Grupp A och Grupp B
Lägga till ytterligare kolumner
- dra in kategorier i excel-blad
Hur struktureras data i ett data warehouse (modellering)? (3)
Stjärnschema/dimensionell modellering
- faktatabellen (eller tabellerna) omges av en dimensionstabell per dimension
- denormaliserad
Data vault modellering
- baserad runt modelleringskonstrukterna hubs, links, satellites
- mer flexibel än dimensionell modellering (mer normaliserad)
Anchor modelling
- baserad runt modelleringskonstrukterna anchor, attribute, tie and knot
- mer normaliserad och hanterar förändring bättre
Vilka olika typer av attribut finns i OLAP-gränssnitt? (2)
Dimensioner/perspektiv
- på vilket sätt man tittar på fakta
(multidimensionellt perspektiv)
Fakta/mättal
- värde som man får fram
Vad är MOLAP-teknologi?
Lagrar data i en arraystruktur (kallas ibland för kub) i stället för en relationsdatabas
- möjliggör avancerad multidimensionell indexering för mycket snabb access
(kräver mycket utrymme)
Vad är ROLAP-teknologi?
Bygger på relationsdatabashanteringssystem, aggregerade tabeller, SQL-frågor och extentioner till SQL (Cube, Crossjoin).
Beräkningar sker “on the fly” av databashanteringssystem
Vad är HOLAP-teknologi?
Bygger på en hybrid av MOLAP och ROLAP där användaren bestämmer vilka data som ska lagras i MOLAP (för snabbare access)
Vad är ett Visual Data Discovery-verktyg?
Verktyg som stödjer interaktion och erbjuder användare visuella medel för att presentera och analysera data samt visa på/föreslå samband/associationer som användaren inte tänkt på
Vilka fördelar finns med data warehouse? (5)
Ökad informationskvalitet
Snabba svar på frågor
Stödjer multidimensionell analys
Möjliggör historisk data
Avlastar operativa system från frågor av analytisk typ