ZIS Flashcards
Data
- Údaje popisující jevy v reálném světě, smyslu nabývají ve spoejní s kontextem
- Údaje získané měřením, pozorováním nebo jen pouhým zaznamenáním z reálné skutečnosti
Informace
- smysluplné interpretace dat a vztah mezi nimi v určitém kontextu, jsou to data, ke kterým je přiřazen význam
- Informace přinášejí uživateli něco nového
- Předávání informací: kresbou, písmem, mluveným slovem, posunky (navíc)
Znalosti
- schopnosti interpretovat data a získávat z nich informace (informovanost není totéž, co znalost!)
- představují zobecněné poznání (určití části) reality
- znalosti = informace + předpoklady + zkušenost
Příprava datové základny
- datové modelování
- definují a analyzují se požadavky na strukturu dat
- výsledkem je datový model – popisuje formát, strukturu dat v systémech a určují vzájemné vztahy datových prvků
- prvky datového modelu: entity, vazby, atributy (entity jsou provázány vazbami)
- cílem datového modelování je navrhnout kvalitní datovou strukturu pro konkrétní aplikaci a databázový systém, který bude aplikace využívat k uložení dat
Kvalita dat
soubor znaků pomocí kterých popisujeme požadované vlastnosti dat, jako jsou bezchybnost, důvěryhodnost, integrita, dostupnost nebo spolehlivost.
Získávání dat – proces ETL
Proces ETL, kvalita dat, archivace, zálohování
Proces ETL = získávání dat. Data, ukládaná a zpracovávaná v transakčních
systémech neumožňují provádění kvalitních analýz - provádění analýz na
základně relacemi propojených tabulek je velmi obtížné. Data z provozních
databází jsou transformována do datového skladu. Uložení dat odpovídá
tvaru vhodnějšímu k analytickému zpracování. Informace se do datových
skladů ukládají pomocí datových pump z provozních databází (tzn. z
databází podnikových informačních systémů - ERP, CRM atd.). Nástroje
datové pumpy se také někdy označují jako ETL - extraction, transformation a
loading.
Proces ETL
1. Ve fázi extrakce vybíráme data.
2. Fáze transformace znamená ověření a čištění dat (= doplnění chybějících hodnot,
odstranění překlepů, převedení na shodné formáty, párování na jednotné číselníky/
dimenze), datovou konsolidaci a výpočet agregací dle hlavních entit.
3. Fáze loading je vložení dat do datového skladu.
4. Datové pumpy pracují dávkově, proces transformace dat z provozních databází do
datového skladu může být časově náročný.
Archivace
je proces, který slouží k dlouhodobému uchování dat, Představuje především shromažďování informací pro případné pozdější použití.
Zálohování
Vytváření bezpečnostní kopie dat nebo celého operačního systému tak, abychom mohli v případě havárie některé součásti počítače, obnovit stav, který existoval těsně před vznikem poruchy”.
Databáze
Databázový systém = databáze, databanka nebo datová základna je soubor
strukturovaných dat. Databáze jsou tvořeny jednou nebo více tabulkami,
které jsou navzájem propojeny pomocí klíčů. V širším smyslu jsou součástí
databáze i softwarové prostředky, které umožňují manipulaci s uloženými
daty a přístup k nim. Tento software se v české odborné literatuře nazývá
systém řízení báze dat (SŘBD). Běžně se označení databáze - v závislosti na
kontextu - myslí jako uložená data, tak i software SŘBD. Metadata = jsou
data, která poskytují informace o jiných datech. V tabulkách jsou uloženy
hodnoty vlastností objektů. Při vyhledávání informací v databázi vytváříme
mezi tabulkami relaci (propojení), pomocí níž získávám požadovaná data.
Index
slouží ke zrychlení vyhledávacích a dotazovacích procesů v databázi, primární klíč je vždy indexem
Druhy struktur databázového systému
- Hierarchický model
- Síťový model
- Relační model dat
Hierarchický model
data jsou organizována do stromové struktury. Každý záznam představuje uzel ve stromové struktuře. Vzájemný vztah mezi záznamy můžeme označit jako rodič a potomek
Síťový model
je v podstatě zobecněním hierarchického modelu, který doplňuje o mnohonásobné vztahy (sety). Tyto sety propojují záznamy různého či stejného typu. Je komplikovaný.
Relační model dat
Model má jednoduchou strukturu, data jsou organizována v tabulkách, které se skládají z řádků a sloupců. Nejmladší a v současné době nejpoužívanější.
Entity-Relationship model
Entity-Relationship model je jedním z nejčastějších návrhových prostředků.
Modeluje „oblast zájmu” jako kolekci entit a vztahů mezi nimi. Entita = nějaká věc nebo
objekt jednoznačně odlišitelná od ostatních, je popsána množinou svých atributů. Vztah =
propojení mezi dvěma či více entitami. Reprezentuje se graficky diagramem. >
Schematické znázornění relační databáze, slouží jako nástroj při návrhu databáze, entita =
tabulka v databázi, atributy = sloupce tabulky, řádky = jednotlivé záznamy a vztahy
vyjadřují vztahy mezi tabulkami.
Atributy, pole
Atributy jsou množinou, která popisuje vlastnosti všech prvků patřících do
příslušné množiny entit. Fakticky je tím definována struktura datového typu
(= záznamu), který nese informaci o každém prvku množiny. Zkráceně:
Atributy = vlastnosti, které se u objektů (entit) sledují, tvoří sloupce tabulky,
mohou nabývat různých hodnot a pole jsou určitého datového typu (číslo,
text, datum apod.).
Primární klíč
Primární klíč jednoznačně identifikuje záznam (řádek tabulky), je to takový
atribut, který má pro každou entitu jedinečnou hodnotu, např. rodné číslo,
většinou je to pomocné pole s identifikačním číslem záznamu (ID).
Primární klíč by měl mít dvě základní vlastnosti: jedinečnost v rámci tabulky
& NE-NULLovou hodnotu. Zpravidla by se databázový systém měl
navrhnout tak, aby se primární klíč záznamu nemusel již nikdy měnit.
Cizí klíč
je to takový atribut, který je v jiné tabulce primárním klíčem
Entitní a vztahový typ, kardinalita vztahu.
Dva typy objektu- entity a vztahy mezi nimi
Vztah mei entitami charakterizuje kardinalita vztahu
• 1:1 – vztah, ve kterém na obou stranách vystupuje pouze jeden objekt dané entity
• 1:n – ne jedné straně je jediný objekt, který je ve vztahu s jedním nebo více objekty na straně druhé.
• m:n – vztahy, kde vystupuje více objektů na obou stranách (např. kino může promítat více než 1 film, film
Vytváření relací, datové typy a zajištění integrity dat.
Po vytvoření relace můžeme tvořit dotazy. Relace je tvoje mezi tabulkami pomocí PK a CK. Obě pole musí být stejného dat.typu. Integrita dat= platnost, přesnost, konzistence. Zajišťuje, že data nebla při pořízení nějak zkreslena.
Informační systém
- Systém pro sběr, přenos, udržování, zpracování a poskytování informací
Složky informačního systému
- Programové vybavení (software)
- Technické vybavení (hardware)
- Databáze (dataware)
- Lidská složka (peopleware)
- Organizační uspořádání (orgware)
- Kontext informačního systému (reálný svět)
Informační společnost
- využívání digitálního zpracování, společnost zaloená na integraci informačních a komunikačních technologií do všem oblastí společenského života
Datové modelování
Datové modelování je jednou z disciplín softwarového inženýrství. Je to
proces, při němž se definují a analyzují požadavky na strukturu dat, s nimiž
pracuje informační systém. Výsledkem tohoto procesu je datový model.
Datové modely popisují (definují) formát a strukturu dat v těchto systémech a
určují vzájemné vztahy jednotlivých datových prvků navzájem, čímž v nich
reprezentují vymezenou část reality. To nám ve výsledném systému
umožňuje s těmito daty manipulovat a využívat je k účelu, ke kterému byly
do tohoto systému zaneseny. Mimo jiné mohou datové modely také sloužit
jako prostředek pro komunikace mezi těmi, kteří definují požadavky na
informační systém, a těmi, kdo tento systém vytvářejí. Datové modelování
tak představuje statický pohled na realitu. Datové modelování je postaveno
na přístupu nazvaném Princip tří architektur (P3A).
Architektura P3A definuje způsob použití abstrakce, což znamená rozčlenit
právě zkoumanou problematiku návrhu datové základny, na mentálně
zvládnutelné části. Skládá se ze třech vrstev - konceptuální, technologické
a implementační.