09 - Datahantering och dataarkitekturer Flashcards
Vad är sant om Master Data Management (MDM)?
MDM kan ske i ett fristående och enkelriktat system som styr alla operationella system. MDM-systemet lagrar masterdataninformationen.
MDM kan ske i samband med ETL.
MDM kan ske i ett fristående och dubbelriktat system som synkroniserar de operationella systemen och analyssystemen och hanterar konflikter. MDM-systemet lagrar den synkroniserade masterdataninformationen.
Vilken är ett Master Data Management-systems (MDM-systems) uppgift?
Det samordnar och ökar korrektheten hos referensdata
Vad innebär det att data behövs i rättan tid (timeliness)?
Data måste finnas tillgängligt när en användare/beslutsfattare behöver det, för att ge störst affärsnytta
vilka problem kan finnas vid datakällor när det gäller datakvalitet?
Data för samma objekt kan skilja sig åt i olika operationella system.
Olika operationella system kan ha olika termer som egentligen pekar på samma begrepp i verksamheten.
Viss relevant data kanske inte går att mata in på ett bra sätt, t ex saknas ett fält för detta i användarens vy.
Vad är sant om datakvalitet?
Data i relationsdatabaser och operationella system har numer bra datakvalitet, men data från nya datakällor t ex från sociala media har ofta låg datakvalitet.
Data ska vara logiskt sammanhållen, fullständig, och korrekt (consistent, complete, accurate) för att ha hög datakvalitet.
Datakvalitet bör ställas i relation till syftet
Vad består Data Latency av?
Capture Latency
Analysis Latency
Decision Latency
Vad saknas i följande mening: “___ är det ramverk som organiserar sättet att skapa strategier, sätta mål, och ge riktlinjer för hanteringen av verksamhetsdata”?
Data Governance
Vad är sant vad gäller Data Warehousing-arkitekturer?
Den del av en Data Warehouse-lösning (oavsett arkitektur) som BI-verktyg hämtar data från, måste vara anpassad för att underlätta användarnas förståelse.
Att hantera semantik i Text Mining är viktigt för att
veta att “jycke” och “vovve” refererar till samma koncept
Vilka är de tre främsta källorna för data till Web Mining?
Loggar över vilka länkar vi klickar på
Dokumentinnehåll
Länkar mellan dokument
Teorier från Social Network Analysis lämpar sig väl för Web Mining därför att:
varje webbsida kan ses som en aktör och varje hyperlänk som en relation mellan aktörerna.
I Supervised Learning lär sig programmet från:
Exempel givna av en människa
Web Usage Mining kan användas för att:
Bilda oss en uppfattning om våra kunders köpvanor
Web Structure Mining kan användas för att:
Att bedöma en webbsidas trovärdighet
Analysera ett företags interna struktur
Att hantera syntax i Text Mining är viktigt för att:
veta vad som är subjekt och vad som är objekt i en mening.