from pdf notes Flashcards
Principy business Intelligence
Úlohy informatiky podporující analytické, plánovací a rozhodovací činnosti podniků (analýzy tržeb ve vztahu k zákazníků, analýzy výrobních kapacit…)
Dva odlišné charaktery aplikací – transakční vs. analytické a plánovací
Transakční úlohy
Zajištění rychlého přístupu k datům
Efektivní provedení všech požadovaných operací
Aktualizování údajů podle změnových dat
Tvorba nových dat, popřípadě příprava dokumentů na základě dat
Analytické a plánovací úlohy
Hodnocení sledovaných podnikových ukazatelů na definovaném rozsahu (analýza na něčem – v čase, podle zákazníků, podle místa…) podnikových dat
Analýza těchto ukazatelů podle různých hledisek a kombinací v různých úrovních detailu
Sledování vývoje ukazatelů a jejich výkyvů v čase
Hlavní rozdíl: transakční aplikace data tvoří a zpřístupňují, analytické aplikace využívají existující data a transformují je podle potřeby
Hlavní úkoly: účelná podpora řídících aktivit ve firmě – podpora analýzy, plánování a rozhodování na všech úrovních a ve všech oblastech podnikového řízení (marketing, finance, controlling, majetek, HR, výroba…)
Hlavní principy BI
1) Určena pro analytické a plánovací aplikace – tomu odpovídá organizace dat v databázích
2) Uchovávání dat na potřebné úrovni detailu (detailní i agregovaná)
3) Práce primárně s daty podnikových ukazatelů – různé dimenze a kombinace
4) Využití časové dimenze – ukládání dat v časových intervalech
5) Má vyšší nároky na kvalitu dat
Výběr a organizace dat
Zdrojové databáze: databáze vytvořené pomocí transakčních aplikací (ERP, CRM)
Transakční databáze: přístup k detailním datům, ukládání a aktualizace dat
Analytické databáze: efektivní poskytování analytických informací – organizace dat ve shodě s potřebami analytických úloh (hodnoty ukazatelů ve vazbě na analytická hlediska)
Mezi oběma druhy databází musí proběhnout transformace dat
ETL (Extract, Transform, Load): databázová pumpa – soubor programů na výběr dat ze zdrojových databází, jejich transformaci a fyzické uložení do analytických databází
Dimenze a granularita dat
Dimenze: analytické hledisko pro hodnocení sledovaných ukazatelů
Dimenze z IT pohledu: struktura dat, nebo databázová tabulka obsahující záznamy o jednotlivých prvcích dimenze (položky zboží) zaznamenaných v hierarchické struktuře
Str. 2
Ukládání dat: nejdetailnější data na nejnižší úrovni hiearchie, agregovaná data o jeden stupeň výš – dril-down/dril-up princip
Vložit obrázek
Co to je granularita
V informatice se granularita vztahuje na poměr výpočtu ke komunikaci - a také v klasickém smyslu k rozdělení velkých holistických úkolů na menší, jemněji delegované úkoly.
Multidimenzionalita dat v prostředí relační databáze
V centru schémat je tabulka faktů (sledovaných ekonomických ukazatelů indentifikovatelných složeným klíčem)
Použití normalizované tabulky – při častých změnách a aktualizacích
Použití denormalizované tabulky – pokud chceme často dotazovat (větší rychlost)
Star schéma: v jedné tabulce je celá hierarchická struktura dimenze (identifikátory a názvy vyšších úrovní se musí opakovat)
Snowflake schéma: rozdělení dimenzionální tabulky podle hierarchických úrovní
Databáze datového skladu: kvůli komplikovanosti se musí propojit několik star a snowflake modelů podle logické příbuznosti, stejných přiřazených dimenzí s stejných společných klíčů (sdílené dimenze)
Multidimenzionalita dat v prostředí OLAP technologie
Princip OLAP: koncepce multidimenzionálních databází – principem je multidimenzionální tabulka umožňujícíc rychlé změny jednotlivých dimenzí a tudíž rychlé změny nahlížené modelované ekonomické reality
Výhody OLAP: rychlost zpracování a efektivní analýzy multidimenzionálních dat
Faktory, komponenty a přístupy řešení BI
Uspořádání komponent BI: liší se podle situace a potřeb daného podniku
Komponenty řešení BI: podstatné faktory ovlivňující způsob řešení projektů (důležité rozhodnutí použití datového skladu, nebo datových tržišť)
Aplikační faktory: faktory odpovídající komponentám BI a jejich řešením
Hlavní součásti faktorů: vymezení podstaty, efekty, rizika, problémy s využitím
Směřování řešení BI: vysoká integrace jednotlivých komponent, včetně integrace s ostatními produkty (ERP, office apod.)
Produkční (zdrojové) databáze
Databáze aplikací (většinou transakčního charakteru), ze kterých BI databáze získávají data
Příklad: ERP, SCM, CRM, Oracle, BB/2…
Mohou zahrnovat ale i malé databáze, nebo tabulky – Access, Excel, Flat Files
Zdroje mohou být i externí (analytické společnosti, výstupy statistických úřadů apod.)
Významné charakteristiky transakčních systémů:
Neustálý rozvoj systémů vede k vývoji struktury dat – to je nezbytné sledovat a upravovat podle toho transakční procedury
Mohou mít oproti relačním databázím spoustu problémů a nejasností – nutné hlídat kvalitu dat a případně je opravovat, pokud se to vůbec vyplatí
Kvůli špatné možnosti dokumentovat tyto systémy je nutné dokumentaci v nezbytné míře doplnit
Extract, Transform, Load (ETL/ELT)
Taktéž nazýváno datová pumpa
Extract: vybrat data ze zdrojových systémů
Transform: upravit je do požadované formy
Load: nahrát je do datových struktur (datového skladu/tržiště)
Přenášení dat po dávkách – v určitých časových intervalech
Časově a finančně velmi náročné
Významné charakteristiky ETL:
Musí být vybrána správná data – pouze pro analytické, plánovací a rozhodovací aktivity podniku
Nové datové struktury musí být předem vhodně navrženy pro potřeby řízení podniku
Musí dojít ke konsolidaci dat – vyloučení duplicit (kvůli různým zdrojovým databázím)
Je nutné dosáhnout potřebné kvality dat – vyloučit nepřesnosti a chyby
Datový sklad (DWH)
Subjektově orientovaný: rozdělení dat podle jejich typu (ne podle aplikace)
Integrovaný: ukládání dat v rámci celého podniku
Stálý: většinou pouze pro čtení, nová data se zpravidla nevkládají
Časově rozlišení: uložena i historie – obsahují časovou dimenzi
Využití především normalizovaných dat
Realizace: relační databázové systémy (Oracle, MS SQL, DB/2)
Datové tržiště
Mnohdy denormalizovaná a lépe srozumitelná data
Rozdíl od datového skladu:
Určení pro omezený okruh uživatelů (oddělení, pobočka, závod)
Umožnění pokrytí konkrétní problematiky – flexibilní analýzy
Jednodušší, levnější a bezpečnější zavádění
OLAP databáze
Obsahují již předzpracované agregace podle definovaných struktur a jejich kombinací
Dočasné uložiště dat
Uložiště pro extrahovaná data
Příprava a zkvalitnění před vstupem do datového skladu
Data detailní, neagregovaná, nekonzistentní a bez časové dimenze
Po přenosu dojde k odstranění
Operační datový sklad
Místo integrace aktuálních dat a řešení konsolidace dat
Mnohdy centrální databáze základních číselníků (zákazníci, produkty apod.)
Umožnění interaktivní komunikace se zákazníkem – využití v kontaktních centrech (profily zákazníků, používané produkty…)
Data bez historie (stále se měnící s každým nahráním), doplněná o agregace, konsistentní, subjektově orientovaná
Hlavní cíl: zpřístupnění dat pro analýzy s minimálním zpožděním oproti jejich pořízení
Reporting
Pomocí klientských aplikací
Dotazování se do databází (datových skladů, multidimenzionálních databází a analyzických aplikací)
Analytické aplikace
Pomocí klientských aplikací
Dotazování se do databází (datových skladů, multidimenzionálních databází a analyzických aplikací)
Sledování firemních procesů, plnění cílů apod.
On-line analýzy trendů
Velká vypovídací hodnota a jednoduché ovládání
Realicezace nad OLAP databázemi