Tenta begrepp Flashcards
Vad är dataintegration och hur används den?
Det är processen att sammanföra och sammanfoga data från olika källor för att skapa en enhetlig vy.
Den används genom att kombinera information från olika databaser eller system för att få en helhetsbild. Exempelvis en organisation integrerar försäljningsdata från butiksregistret och online plattformen för att analysera samlad försäljningsprestanda.
Vad innebär GDPR (General Data Protection Regulation) och hur används den?
Det är en europeisk lagstiftning som reglerar hur personlig information behandlas och skyddas.
GDPR används genom att ställa krav på organisationer att säkerställa korrekt och säker hantering av personuppgifter.
Exempel: En företagssida måste be om samtycke innan den samlar in och använder personlig information från sina besökare.
Vilka tre mått finns det på Data Quality och varför ska man arbeta med det?
Data Quality är måttet på noggrannheten, fullständigheten och relevansen av data.
Det används i organisationer som strävar efter att förbättra datakvaliteten för att fatta bättre beslut.
Exempel: Ett företag rensar och korrigerar sina kunduppgifter för att undvika felaktig fakturering och förbättra kundtillfredsställelse.
Vad är API (Application Programming Interface) och hur används det?
API är ett gränssnitt som tillåter olika program att kommunicera med varandra.
Det API möjliggör är integration mellan olika mjukvarusystem.
Exempel: En betalningsgateway-API används för att behandla betalningar på en e-handelswebbplats.
vad är Repository och hur används den ?
Repository är en centraliserad plats där data lagras och hanteras.
Användning: Ett datarepository fungerar som en lagringsplats för att organisera och lagra olika typer av data. Exempel: En SQL-databas som lagrar användarinformation för en webbapplikation.
vad är Connectionstring och hur används den?
Connectionstring är en sträng som innehåller information om hur man ansluter till en databas eller annat datalagringsmedium.
Connectionstring Används av program för att etablera en anslutning till en databas. Exempel: En connectionstring innehåller serveradress, databasnamn och autentiseringsuppgifter för att ansluta till en SQL-databas.
I Data integration Blueprint and Modeling berättas det om 4 olika integrationsarkitekturer. Vilka är det?
- ETL
- Enterprise Application Integration (EAI)
- Service-Oriented Architecture (SOA)
- Federation
Vilka är de tre största kategorierna i e-handelns fördelning 2019? med fokus på gästföreläsningen.
Resor, varor, tjänster
Vad innebär integrationsarkitekturer ETL
ETL handlar om att samla och sammanställa transaktionsdata, som extraheras från flera källor för att formateras till databaser som används för rapportering och analys.
Vad innebär integrationsarkitekturer Federation
Innebär att data förblir decentraliserad, men det skapas en gemensam vy genom att tillåta sökningar eller frågor över flera databaser. Varje databas förblir självständig, men federationen möjliggör en översiktlig vy.
Federation är lämplig när det krävs snabbhet i att sammanföra data från olika miljöer utan att datan är transaktionell
Vad innebär integrationsarkitekturer Service-Oriented Architecture (SOA)
Bygger på konceptet av en “service” som är självständiga, återanvändbara och distribuerade. Systemet utvecklas som en samling tjänster som kan anropas över nätverk för att uppfylla specifika affärsbehov.
Vad innebär integrationsarkitekturer Enterprise Application Integration (EAI)
Fokuserar på att integrera olika applikationer inom företaget så att de kan kommunicera och dela data sömlöst. Applikation skapar en transaktion, granskar och uppdaterar “sökuppgifter” för transaktionen och slutligen begår transaktionen
Använder oftast mellanprogramvara för att underlätta direkt kommunikation mellan applikationer.
Vilka är de tre största anledningarna till att handla på nätet 2019?
För att spara tid / Det är enklare, lägre pris, enkelt att jämföra produkter och priser
Svag databasdesign är en av utmaningarna i samband med integrationslösningar, beskriv 4 vanliga problem som har med databasdesignen att göra.
- Sorteringen funkar inte: Foreign key contraint användes inte och därför blev det fel när ”samma kolumn” i två olika tabeller hade olika längt.
- Det finns mycket redundant data i tabellen: En och samma produkt kan finnas på flera rader med olika priser.
- Otydligt hur datan är relaterad: Icke normaliserad data, en lista med siffror i ett fält.
- Varför kraschar vår server när vi vil hämta ut statestik: Man ska inte ta ut statestik från det operationella systemet.
Ge exempel på möjliga utdata från exempelvis ett affärssystem (välja själv tänkt mottagare) i följande filformat.
PDF
En chef kanske skulle vilja ha en rapport över produktionskostnader.
Ge exempel på möjliga utdata från exempelvis ett affärssystem (välja själv tänkt mottagare) i följande filformat.
SMS
En kund som får en orderbekräftelse med leveransdatum
Ge exempel på möjliga utdata från exempelvis ett affärssystem (välja själv tänkt mottagare) i följande filformat.
CSV
En analytiker som vill flytta in data i ett annat system som ett data warehouse, exempelvis transaktioner
Ge exempel på möjliga utdata från exempelvis ett affärssystem (välja själv tänkt mottagare) i följande filformat.
Google maps
Logistiktekniker som vill ha data över vilka koordinater som bildar ett geografiskt område för specifika transportkostnader.
Big data
Big data är ofta definierat av tre (ibland fem) V:n, “volume, velocity and variety”. Stora volumer, som skapas med hög hastighet och stor variation.
Big Data refererar till stora och komplexa datamängder som är för stora för att hanteras effektivt av traditionella databearbetningsmetoder
Cleaning data
Rensa bort Human error och icke logiska data punkter.
Backfilling data
om data saknas så fyller man på med det som är mest trovärdigt
Data mining
är en process att extrahera och upptäcka insikter i stora mängder data
EX: användning av AI och statistiska metoder.
logging
Är processen att anteckna resultat eller händelser i den ordning de inträffar.
Metadata
Metadata definieras som “data om data” och skapas vid skapandet av data och inkluderar regler, processer och inställningar.
Metadata hjälper användaren att:
- Ge kontext till rådata
- Använda rådata som information
- Insyn av de affärsmässiga och tekniska reglerna som ger detta dataelement betydelsen
- Målet är att fånga denna information vid skapandet för att undvika återupptäckt senare.
Trunkera data
Innebär att avkorta eller ta bort delar av data för att öka kvalité, minska data mängd och underlätta hanteringen av integritetsfrågor.
Varför är dataintegration viktigt?
- Minska kostnader för åtgärder av data
- Effektivitetsförbättringar
- Stöd för beslutsfattande
- Konkurrensfördelar
Vilka typer av dataintegrationsmodeller finns det?
konceptuell modell, logisk modell och fysisk modell
Vilka två olika typer av data quality check defineras och hur kan dem användas?
- Affärs data: Kvalitetskontrollen av affärs data är exempelvis attribut för kön där det inte finns ett helt uppenbart val av vad som är rätt definiering för det.
- Tekniska data: Teknisk definition av data kan exempelvis vara att primär nyckel inte får att nullvärde
Vad innebär Konceptuella dataintegrationsmodellen?
Den konceptuella modellen är en implementationsfri representation av dataintegrationskraven. Den ger en hög nivå av översikt över dataintegrations-processerna utan teknisk detalj
Vad innebär Logiska dataintegrationsmodellen?
Logiska modellen producera en mer detaljerad representation av dataintegrationskraven exempelvis:
- källkartläggning
- affärsregler
- målbild av data (tabellform).
Logiska modellen möjliggör noggrann planering av dataintegrationen innan den faktiska implementeringen påbörjas
Vad innebär Fysiska integrationsmodellen?
Fysik dataintegrationsmodeller är att skapa en detaljerad representation av dataintegrationens specifikationer på komponentnivå.
Ett viktigt koncept inom fysiska data modellering är att bestämma hur man på bästa sätt använder den logiska designen och applicerar olika designtekniker för att optimera prestandard.
Data Governance
Ett ramverk för att definiera och styra hur organisationer använder och hanterar sina dataresurser.
Enligt litteraturen är DG en orkestrering av människor, processer och teknik för att göra det möjligt för en organisation att utnyttja data som en företagstillgång.
Vilka är de tre valutorna av värde
- (GSR) Varor, Service och Vinst (Goods, services & revenue)
- Kunskap (knowledge)
- Immateriella fördelar
(GSR) Varor, Service och Vinst (Goods, services & revenue)
Det beskriver utbyten av tjänster eller varor, inklusive alla transaktioner som involverar kontrakt och fakturor, mottagande av order, begäran om förslag, bekräftelser eller betalningar. Kunskapsprodukter eller tjänster som genererar intäkter eller förväntas som en del av tjänsten (till exempel rapporter eller produktblad) ingår i flödet av varor, tjänster och intäkter.
Kunskap (knowledge)
Utbyten av strategisk information, planeringskunskap, processkunskap, teknisk know-how, samarbetsinriktad design, policyutveckling etc., som flödar runt och stödjer kärnprodukten och tjänstevärdekedjan.
Immateriella fördelar (Intangible benefits)
Är fördelar och värden som sträcker sig bortom den faktiska tjänsten och som inte redovisas i traditionella finansiella mått
Exempelvis:
- känsla av gemenskap
- kundlojalitet
- bildförbättring
- samarbeten för varumärkesutveckling.