Data warehousing & data bases Flashcards
Vilka tre punkter kännetecknar ett data warehouse enl slidesen?
- En fysisk förvaringsplats där relaterade information är speciellt
organiserade för att lämna över hela företaget, rengjorts information i ett
standardiserat format. - En sammanställning av information från flera källor, utförd på ett sådant
sätt att det underlättar en avancerad analys av informationen, att
analysen kan utföras utan mera djupgående IT-kunskaper. - Datalagret har en struktur som är optimerad för att kunna lagra stora
mängder historisk data oftast anordnad i dimensions- och faktatabeller.
Ge tre anledningar till att det är bra med data warehousing.
Meningsfull och relevant information för beslutssituationer
Snabb tillgång till information
En enda källa att hämta data från - lättillgängligt
Pålitlig information, ej inkonsistenta rapporter
Begripliga strukturer och begrepp
Enkla distributionsvägar
Personanpassat gränssnitt
Vad är “the characteristics” av datalagring? (nämn minst 3)
Subject oriented
Integrated
Time variant (time series)
Nonvolatile
Web based
Relational/multidimensional
Client/server
Real-time
Vad är OLAP (Online analytical processing)?
Online Analytical Processing, eller OLAP, är en teknik för att ge snabba exekveringar och returer på flerdimensionella databassökningar. OLAP-kuben, alternativt kallad multidimensionell kub eller hypercube, är OLAP:s kärna.
Vad är drill down?
Det är någonting du kan göra inom OLAP där du först “dicear” (dvs tar en ..dice.. av information från OLAP-kuben) som i sin tur innehåller massa egna små kuber med subinformation. Börjar översiktligt och går djupare
Vad är Online Transactional Processing (OLTP)?
technology used to perform updates on operational or transactional systems
Hur skiljer sig OLAP och OLTP?
OLAP är kan göra mycket mer komplexa analyser på större mängd data och används för datalager, medan OLTP används för databaser.
Vilka 4 krav finns på ett datalager?
- Subjektorienterat
– data som berör samma affärsobjekt eller samma händelse lagraslogiskt tillsammans - Tidsvariant (time variant)
– förändringar i tiden skall inte raderas, utan lagras som historisk data - Konstant (non-volatile)
– data skrivs aldrig över, utan behålles för historisk analys - Integrerat
– informationslagret hämtar data från alla affärsapplikationer i ett företag
Vad är ETL och vad innebär varje steg?
Extract: In this step, data is gathered or “extracted” from different sources such as databases, files, applications, or other systems. It’s akin to collecting information from various places where it resides.
Transform: Once the data is collected, it often needs to be transformed or modified to fit a particular structure or standard. This might involve cleaning the data (removing duplicates or correcting errors), converting data types, integrating data from different sources, or even performing calculations or derivations. The goal here is to make sure the data is in a consistent format suitable for analysis.
Load: Finally, the transformed data is loaded into a target database or data warehouse where it can be used for analysis, reporting, or any other applications. This is like placing the organized and standardized data into a storage place where it’s easily accessible and ready for use.
- courtesy of chat-gpt
Vad är “the relational model” i kontexten databaser?
Data are organized in two dimensional tables (relations)
* Tables are related to each other