10 Datahantering och Dataarkitektur Flashcards

1
Q

Vilka fem “pelare” bör dataarkitekturen för BI baseras på?

A

Datakvalitet

Databredd (flera källor)

Data i rätt tid (timeliness)

Relevant data (ska ge affärsnytta)

Rätt detaljnivå på data (granularity)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad innebär databredd och hur samlas denna data in?

A

Flera datakällor:

  • data-warehouse lösningar för att komma åt data från alla operationella systemen
  • big data levererar än mer data
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad innebär datakvalitet? (3)

A

Att datat är:

Logiskt sammanhållen (consistent)

Fullständig (complete)

Korrekt (accurate)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad påverkar datakvalitet? (2)

A

Datakvalitén börjar vid inmatningen:

  • felaktiga inmatningsfält
  • förkortningar/stavfel

Operationella system är inkonsistenta:

  • olika begrepp
  • olika information (samma kund i olika system)

Kan påverkas i ETL = Transformeringen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vad är Data Governance?

A

Data Governance [kontroll över, och styrning av, data] är det ramverk som organiserar sättet att skapa strategier, sätta mål, och ge riktlinjer för hanteringen av verksamhetsdata

  • tex gemensamma verksamhetsdefinitioner (vad innebär “kund”?)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad innebär Inmon-arkitekturen?

lagring, hämtning

A

Data lagras relationellt, detaljerat, på ett ställe, höggradigt normaliserat

Data marts optimerade för BI-utvinning byggs runt detta, speglar centrala data
- ibland endast visuella vyer (datan finns i databasen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad innebär Kimball-arkitekturen?

lagring, hämtning

A

Data lagras dimensionellt, i denormaliserade stjärnscheman med gemensamma dimensioner

Data hämtas antingen direkt från källsystem, eller från data lagrat i staging-området (ETL)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vilka två nya tekniklösningar dataarkitekturer finns?

A

Extremt snabba in-memory-tekniker:
- stora datamängder lagras i primärminnet (RAM)

Lagring i Hadoop DFS:
- data kan sedan tex laddas in i ett Data Warehouse och/eller… laddas in i ett in-memory-system för analys

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad är MDM?

A

(Master Data Management)

- tekniker för att öka referensdatas korrekthet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad gör ett MDM-system?

A

MDM-systemet förser
transaktions- och andra källsystem med korrekta värden på referensdata (kundkoder, artikelkoder, etc)

  • underlättar överföring till ett data warehouse
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hur fungerar ett dubbelriktat MDM-systen?

A

MDM-lagringen sker ”mellan” de operationella systemen och analyssystemen

Alla de tre delarna kan initiera nyupplägg och ändringar
– men MDM-systemet sköter synkronisering och ev. konflikthantering

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vad menas med “i rättan tid” gällande dataarkitektur?

A

Man vill reducera Data Latency

- data ska uppdateras i realtid för att förminska felaktigt beslutsfattande

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vilka olika typer av “Latency” pratas det om kopplat till BI och vilka aktiviteter är kopplade till dessa? (3)

A

Capture latency
- händelse -> källsystem -> BI-system

Analysis latency
- BI-system -> dashboard/rapport/varning

Decision latency
- analys (t ex rapport) -> beslut

How well did you know this?
1
Not at all
2
3
4
5
Perfectly