ZIS Flashcards
Data
- Údaje popisující jevy v reálném světě, smyslu nabývají ve spoejní s kontextem
- Údaje získané měřením, pozorováním nebo jen pouhým zaznamenáním z reálné skutečnosti
Informace
- smysluplné interpretace dat a vztah mezi nimi v určitém kontextu, jsou to data, ke kterým je přiřazen význam
- Informace přinášejí uživateli něco nového
- Předávání informací: kresbou, písmem, mluveným slovem, posunky (navíc)
Znalosti
- schopnosti interpretovat data a získávat z nich informace (informovanost není totéž, co znalost!)
- představují zobecněné poznání (určití části) reality
- znalosti = informace + předpoklady + zkušenost
Příprava datové základny
- datové modelování
- definují a analyzují se požadavky na strukturu dat
- výsledkem je datový model – popisuje formát, strukturu dat v systémech a určují vzájemné vztahy datových prvků
- prvky datového modelu: entity, vazby, atributy (entity jsou provázány vazbami)
- cílem datového modelování je navrhnout kvalitní datovou strukturu pro konkrétní aplikaci a databázový systém, který bude aplikace využívat k uložení dat
Kvalita dat
soubor znaků pomocí kterých popisujeme požadované vlastnosti dat, jako jsou bezchybnost, důvěryhodnost, integrita, dostupnost nebo spolehlivost.
Získávání dat – proces ETL
Proces ETL, kvalita dat, archivace, zálohování
Proces ETL = získávání dat. Data, ukládaná a zpracovávaná v transakčních
systémech neumožňují provádění kvalitních analýz - provádění analýz na
základně relacemi propojených tabulek je velmi obtížné. Data z provozních
databází jsou transformována do datového skladu. Uložení dat odpovídá
tvaru vhodnějšímu k analytickému zpracování. Informace se do datových
skladů ukládají pomocí datových pump z provozních databází (tzn. z
databází podnikových informačních systémů - ERP, CRM atd.). Nástroje
datové pumpy se také někdy označují jako ETL - extraction, transformation a
loading.
Proces ETL
1. Ve fázi extrakce vybíráme data.
2. Fáze transformace znamená ověření a čištění dat (= doplnění chybějících hodnot,
odstranění překlepů, převedení na shodné formáty, párování na jednotné číselníky/
dimenze), datovou konsolidaci a výpočet agregací dle hlavních entit.
3. Fáze loading je vložení dat do datového skladu.
4. Datové pumpy pracují dávkově, proces transformace dat z provozních databází do
datového skladu může být časově náročný.
Archivace
je proces, který slouží k dlouhodobému uchování dat, Představuje především shromažďování informací pro případné pozdější použití.
Zálohování
Vytváření bezpečnostní kopie dat nebo celého operačního systému tak, abychom mohli v případě havárie některé součásti počítače, obnovit stav, který existoval těsně před vznikem poruchy”.
Databáze
Databázový systém = databáze, databanka nebo datová základna je soubor
strukturovaných dat. Databáze jsou tvořeny jednou nebo více tabulkami,
které jsou navzájem propojeny pomocí klíčů. V širším smyslu jsou součástí
databáze i softwarové prostředky, které umožňují manipulaci s uloženými
daty a přístup k nim. Tento software se v české odborné literatuře nazývá
systém řízení báze dat (SŘBD). Běžně se označení databáze - v závislosti na
kontextu - myslí jako uložená data, tak i software SŘBD. Metadata = jsou
data, která poskytují informace o jiných datech. V tabulkách jsou uloženy
hodnoty vlastností objektů. Při vyhledávání informací v databázi vytváříme
mezi tabulkami relaci (propojení), pomocí níž získávám požadovaná data.
Index
slouží ke zrychlení vyhledávacích a dotazovacích procesů v databázi, primární klíč je vždy indexem
Druhy struktur databázového systému
- Hierarchický model
- Síťový model
- Relační model dat
Hierarchický model
data jsou organizována do stromové struktury. Každý záznam představuje uzel ve stromové struktuře. Vzájemný vztah mezi záznamy můžeme označit jako rodič a potomek
Síťový model
je v podstatě zobecněním hierarchického modelu, který doplňuje o mnohonásobné vztahy (sety). Tyto sety propojují záznamy různého či stejného typu. Je komplikovaný.
Relační model dat
Model má jednoduchou strukturu, data jsou organizována v tabulkách, které se skládají z řádků a sloupců. Nejmladší a v současné době nejpoužívanější.
Entity-Relationship model
Entity-Relationship model je jedním z nejčastějších návrhových prostředků.
Modeluje „oblast zájmu” jako kolekci entit a vztahů mezi nimi. Entita = nějaká věc nebo
objekt jednoznačně odlišitelná od ostatních, je popsána množinou svých atributů. Vztah =
propojení mezi dvěma či více entitami. Reprezentuje se graficky diagramem. >
Schematické znázornění relační databáze, slouží jako nástroj při návrhu databáze, entita =
tabulka v databázi, atributy = sloupce tabulky, řádky = jednotlivé záznamy a vztahy
vyjadřují vztahy mezi tabulkami.
Atributy, pole
Atributy jsou množinou, která popisuje vlastnosti všech prvků patřících do
příslušné množiny entit. Fakticky je tím definována struktura datového typu
(= záznamu), který nese informaci o každém prvku množiny. Zkráceně:
Atributy = vlastnosti, které se u objektů (entit) sledují, tvoří sloupce tabulky,
mohou nabývat různých hodnot a pole jsou určitého datového typu (číslo,
text, datum apod.).
Primární klíč
Primární klíč jednoznačně identifikuje záznam (řádek tabulky), je to takový
atribut, který má pro každou entitu jedinečnou hodnotu, např. rodné číslo,
většinou je to pomocné pole s identifikačním číslem záznamu (ID).
Primární klíč by měl mít dvě základní vlastnosti: jedinečnost v rámci tabulky
& NE-NULLovou hodnotu. Zpravidla by se databázový systém měl
navrhnout tak, aby se primární klíč záznamu nemusel již nikdy měnit.
Cizí klíč
je to takový atribut, který je v jiné tabulce primárním klíčem
Entitní a vztahový typ, kardinalita vztahu.
Dva typy objektu- entity a vztahy mezi nimi
Vztah mei entitami charakterizuje kardinalita vztahu
• 1:1 – vztah, ve kterém na obou stranách vystupuje pouze jeden objekt dané entity
• 1:n – ne jedné straně je jediný objekt, který je ve vztahu s jedním nebo více objekty na straně druhé.
• m:n – vztahy, kde vystupuje více objektů na obou stranách (např. kino může promítat více než 1 film, film
Vytváření relací, datové typy a zajištění integrity dat.
Po vytvoření relace můžeme tvořit dotazy. Relace je tvoje mezi tabulkami pomocí PK a CK. Obě pole musí být stejného dat.typu. Integrita dat= platnost, přesnost, konzistence. Zajišťuje, že data nebla při pořízení nějak zkreslena.
Informační systém
- Systém pro sběr, přenos, udržování, zpracování a poskytování informací
Složky informačního systému
- Programové vybavení (software)
- Technické vybavení (hardware)
- Databáze (dataware)
- Lidská složka (peopleware)
- Organizační uspořádání (orgware)
- Kontext informačního systému (reálný svět)
Informační společnost
- využívání digitálního zpracování, společnost zaloená na integraci informačních a komunikačních technologií do všem oblastí společenského života
Datové modelování
Datové modelování je jednou z disciplín softwarového inženýrství. Je to
proces, při němž se definují a analyzují požadavky na strukturu dat, s nimiž
pracuje informační systém. Výsledkem tohoto procesu je datový model.
Datové modely popisují (definují) formát a strukturu dat v těchto systémech a
určují vzájemné vztahy jednotlivých datových prvků navzájem, čímž v nich
reprezentují vymezenou část reality. To nám ve výsledném systému
umožňuje s těmito daty manipulovat a využívat je k účelu, ke kterému byly
do tohoto systému zaneseny. Mimo jiné mohou datové modely také sloužit
jako prostředek pro komunikace mezi těmi, kteří definují požadavky na
informační systém, a těmi, kdo tento systém vytvářejí. Datové modelování
tak představuje statický pohled na realitu. Datové modelování je postaveno
na přístupu nazvaném Princip tří architektur (P3A).
Architektura P3A definuje způsob použití abstrakce, což znamená rozčlenit
právě zkoumanou problematiku návrhu datové základny, na mentálně
zvládnutelné části. Skládá se ze třech vrstev - konceptuální, technologické
a implementační.
Konceptuální modelování/vrstva
Zde se snažíme popsat předmětnou
oblast datové základny. Konceptuální návrh určuje, co je obsahem systému.
Nebereme v úvahu pozdější způsoby implementace.
Tři základní komponenty SQL
- DDL (Data definition language) - jazyk pro definici dat
- DML (Data manipulation language) - jazyk pro manipulaci s daty
- DCL (Data control language) - jazyk pro řízení dat
Podmínky, aby dotaz proběhl
- Každý příkaz musí začínat na nové řádce
- Příkaz SQL rozlišuje rezervovaná slova a uživatelem definovaná slova.
- Rezervovaná slova nesmí být dělená do dvou řádků.
- Příkaz SQL bývá dost často ukončen středníkem.
- SQL není case sensitive, jen hodnoty textového argumentu musí být napsány
přesně.
Spojení, restrikce, projekce
Operace spojení se provádí pomocí JOIN
Operace restrikce se provádí pomocí WHERE. Říká nám, které řádky se mají vypsat,
respektive splňují danou podmínku či které řádky se mají aktualizovat, smazat (příkazy
UPDATE nebo DELETE). Je to omezení řádků.
Operace projekce je zobrazení konkrétní položky (sloupce). Jednotlivé řádky tabulky nám
mohou vystupovat jako n-tice hodnot, např. tabulka AUTOR má pětici hodnot (id, jméno,
příjmení, kniha, datum narození) apod. Kdybychom se zajímali o projekci na složku kniha,
zapisujeme P[kniha].
Požadavky na IS
spolehlivost, efektivní provozovatelnost (ve vztahů k nákladům), pružnost (schopnost rozvoje), udržovatelnost, bezpečnost
Dělení IS
- Osobní informatika
- systém SW a HW pro jednotlivce - Podnikové informační systémy
o ERP (Enterprise Resource Planning) cca od roku 1990
- jádro podnikového IS pro evidenci zásob a transakcí (obchod)
- např. SAP, Oracle, Microsoft, NetSuite, ..
- monolitická architektura někdy obtížně inovovatelná
o BI (Business Intelligence)
- - analýzy podnikových dat, které původně nebyly součástí ERP
o ERP II cca od roku 2000 do současnosti
- - ERP + e-Commerce + Business Intelligence
- - architektura orientovaná na služby (SOA)
o ERP III v budoucnu
- - integrace ERP se sociálními sítěmi a moderními formami ICT
Jaké jsou trendy posledních let v oblasti HW, SW, metod
a nástrojů vývoje IS/IT
Trendy posledních let:
1. HW: snižuje se poměr cena/výkon, vyšší nároky na HW a SW
2. SW: technologicky orientovaný SW (office balíky a měření na wokflow), typový
aplikační software s možností parametrizace (komplexní a lze nastavit pomocí
parametrů), disponuje stavební architekturou (lze jednotlivé části přidat či odebrat)
3. IS/IT: aplikace jsou konstruovány tak, že se přechází od jednovrstevné architektury
ke trojvrstevné architektuře, tzn. jednovrstevná = data, funkce i uživatelské rozhraní
agregovány do jednoho celku, trojvrstevná = tyto části jsou oddělené do vrstev,
souvislost s použitím klient / server architektury.
-1. Data a funkce jsou uloženy na serveru, na klientském PC je jen uživatelské
rozhraní
-2. Server provede danou službu a zašle odpověď klientovi, kde je
interpretována pomocí uživatelského rozhraní
-3. Princip oddělení těchto tří celků umožňuje jednoduše vyměnit určitou část
systému
4. Organizace a řízení IS/IT: OUTSOURCING: strategický organizační nástroj, jde o
přesun odpovědnosti za provoz funkční činnosti podniku na externí
specializovanou firmu, aplikuje se v oblastech, které nejsou hlavními oblastmi
podniku.
-1. Outsourcing u vývoje a provozu HW i SW
-2. Outsourcing programátorských týmů (z důvodu nedostatečné kapacit
organizace, spolupráce s kvalitnějšími odborníky)
5. Současné trendy IS/IT: totální digitalizace, od dat k informacím, respektive
znalostem, integrace komunikace (horizontální, vertikální, interní, externí), důraz