from pdf notes Flashcards

1
Q

Principy business Intelligence

A

Úlohy informatiky podporující analytické, plánovací a rozhodovací činnosti podniků (analýzy tržeb ve vztahu k zákazníků, analýzy výrobních kapacit…)
Dva odlišné charaktery aplikací – transakční vs. analytické a plánovací

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Transakční úlohy

A

 Zajištění rychlého přístupu k datům
 Efektivní provedení všech požadovaných operací
 Aktualizování údajů podle změnových dat
 Tvorba nových dat, popřípadě příprava dokumentů na základě dat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Analytické a plánovací úlohy

A

 Hodnocení sledovaných podnikových ukazatelů na definovaném rozsahu (analýza na něčem – v čase, podle zákazníků, podle místa…) podnikových dat
 Analýza těchto ukazatelů podle různých hledisek a kombinací v různých úrovních detailu
 Sledování vývoje ukazatelů a jejich výkyvů v čase

 Hlavní rozdíl: transakční aplikace data tvoří a zpřístupňují, analytické aplikace využívají existující data a transformují je podle potřeby
 Hlavní úkoly: účelná podpora řídících aktivit ve firmě – podpora analýzy, plánování a rozhodování na všech úrovních a ve všech oblastech podnikového řízení (marketing, finance, controlling, majetek, HR, výroba…)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hlavní principy BI

A

1) Určena pro analytické a plánovací aplikace – tomu odpovídá organizace dat v databázích
2) Uchovávání dat na potřebné úrovni detailu (detailní i agregovaná)
3) Práce primárně s daty podnikových ukazatelů – různé dimenze a kombinace
4) Využití časové dimenze – ukládání dat v časových intervalech
5) Má vyšší nároky na kvalitu dat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Výběr a organizace dat

A

Zdrojové databáze: databáze vytvořené pomocí transakčních aplikací (ERP, CRM)
 Transakční databáze: přístup k detailním datům, ukládání a aktualizace dat
 Analytické databáze: efektivní poskytování analytických informací – organizace dat ve shodě s potřebami analytických úloh (hodnoty ukazatelů ve vazbě na analytická hlediska)
 Mezi oběma druhy databází musí proběhnout transformace dat
 ETL (Extract, Transform, Load): databázová pumpa – soubor programů na výběr dat ze zdrojových databází, jejich transformaci a fyzické uložení do analytických databází

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Dimenze a granularita dat

A

 Dimenze: analytické hledisko pro hodnocení sledovaných ukazatelů
 Dimenze z IT pohledu: struktura dat, nebo databázová tabulka obsahující záznamy o jednotlivých prvcích dimenze (položky zboží) zaznamenaných v hierarchické struktuře
Str. 2
 Ukládání dat: nejdetailnější data na nejnižší úrovni hiearchie, agregovaná data o jeden stupeň výš – dril-down/dril-up princip
 Vložit obrázek

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Co to je granularita

A

V informatice se granularita vztahuje na poměr výpočtu ke komunikaci - a také v klasickém smyslu k rozdělení velkých holistických úkolů na menší, jemněji delegované úkoly.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Multidimenzionalita dat v prostředí relační databáze

A

 V centru schémat je tabulka faktů (sledovaných ekonomických ukazatelů indentifikovatelných složeným klíčem)
 Použití normalizované tabulky – při častých změnách a aktualizacích
 Použití denormalizované tabulky – pokud chceme často dotazovat (větší rychlost)
 Star schéma: v jedné tabulce je celá hierarchická struktura dimenze (identifikátory a názvy vyšších úrovní se musí opakovat)
 Snowflake schéma: rozdělení dimenzionální tabulky podle hierarchických úrovní
 Databáze datového skladu: kvůli komplikovanosti se musí propojit několik star a snowflake modelů podle logické příbuznosti, stejných přiřazených dimenzí s stejných společných klíčů (sdílené dimenze)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Multidimenzionalita dat v prostředí OLAP technologie

A

 Princip OLAP: koncepce multidimenzionálních databází – principem je multidimenzionální tabulka umožňujícíc rychlé změny jednotlivých dimenzí a tudíž rychlé změny nahlížené modelované ekonomické reality
 Výhody OLAP: rychlost zpracování a efektivní analýzy multidimenzionálních dat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Faktory, komponenty a přístupy řešení BI

A

 Uspořádání komponent BI: liší se podle situace a potřeb daného podniku
 Komponenty řešení BI: podstatné faktory ovlivňující způsob řešení projektů (důležité rozhodnutí použití datového skladu, nebo datových tržišť)
 Aplikační faktory: faktory odpovídající komponentám BI a jejich řešením
 Hlavní součásti faktorů: vymezení podstaty, efekty, rizika, problémy s využitím
 Směřování řešení BI: vysoká integrace jednotlivých komponent, včetně integrace s ostatními produkty (ERP, office apod.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Produkční (zdrojové) databáze

A

 Databáze aplikací (většinou transakčního charakteru), ze kterých BI databáze získávají data
 Příklad: ERP, SCM, CRM, Oracle, BB/2…
 Mohou zahrnovat ale i malé databáze, nebo tabulky – Access, Excel, Flat Files
 Zdroje mohou být i externí (analytické společnosti, výstupy statistických úřadů apod.)
 Významné charakteristiky transakčních systémů:
 Neustálý rozvoj systémů vede k vývoji struktury dat – to je nezbytné sledovat a upravovat podle toho transakční procedury
 Mohou mít oproti relačním databázím spoustu problémů a nejasností – nutné hlídat kvalitu dat a případně je opravovat, pokud se to vůbec vyplatí
 Kvůli špatné možnosti dokumentovat tyto systémy je nutné dokumentaci v nezbytné míře doplnit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Extract, Transform, Load (ETL/ELT)

A

 Taktéž nazýváno datová pumpa
 Extract: vybrat data ze zdrojových systémů
 Transform: upravit je do požadované formy
 Load: nahrát je do datových struktur (datového skladu/tržiště)
 Přenášení dat po dávkách – v určitých časových intervalech
 Časově a finančně velmi náročné
 Významné charakteristiky ETL:
 Musí být vybrána správná data – pouze pro analytické, plánovací a rozhodovací aktivity podniku
 Nové datové struktury musí být předem vhodně navrženy pro potřeby řízení podniku
 Musí dojít ke konsolidaci dat – vyloučení duplicit (kvůli různým zdrojovým databázím)
 Je nutné dosáhnout potřebné kvality dat – vyloučit nepřesnosti a chyby

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Datový sklad (DWH)

A

 Subjektově orientovaný: rozdělení dat podle jejich typu (ne podle aplikace)
 Integrovaný: ukládání dat v rámci celého podniku
 Stálý: většinou pouze pro čtení, nová data se zpravidla nevkládají
 Časově rozlišení: uložena i historie – obsahují časovou dimenzi
 Využití především normalizovaných dat
 Realizace: relační databázové systémy (Oracle, MS SQL, DB/2)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Datové tržiště

A

 Mnohdy denormalizovaná a lépe srozumitelná data
 Rozdíl od datového skladu:
 Určení pro omezený okruh uživatelů (oddělení, pobočka, závod)
 Umožnění pokrytí konkrétní problematiky – flexibilní analýzy
 Jednodušší, levnější a bezpečnější zavádění

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

OLAP databáze

A

 Obsahují již předzpracované agregace podle definovaných struktur a jejich kombinací

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Dočasné uložiště dat

A

 Uložiště pro extrahovaná data
 Příprava a zkvalitnění před vstupem do datového skladu
 Data detailní, neagregovaná, nekonzistentní a bez časové dimenze
 Po přenosu dojde k odstranění

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Operační datový sklad

A

 Místo integrace aktuálních dat a řešení konsolidace dat
 Mnohdy centrální databáze základních číselníků (zákazníci, produkty apod.)
 Umožnění interaktivní komunikace se zákazníkem – využití v kontaktních centrech (profily zákazníků, používané produkty…)
 Data bez historie (stále se měnící s každým nahráním), doplněná o agregace, konsistentní, subjektově orientovaná
Hlavní cíl: zpřístupnění dat pro analýzy s minimálním zpožděním oproti jejich pořízení

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Reporting

A

Pomocí klientských aplikací
 Dotazování se do databází (datových skladů, multidimenzionálních databází a analyzických aplikací)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Analytické aplikace

A

 Pomocí klientských aplikací
 Dotazování se do databází (datových skladů, multidimenzionálních databází a analyzických aplikací)
 Sledování firemních procesů, plnění cílů apod.
 On-line analýzy trendů
 Velká vypovídací hodnota a jednoduché ovládání
 Realicezace nad OLAP databázemi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Dolování dat

A

 Extrakce relevantních informací z rozsáhlé databáze
 Analýzy odvozené z obsahu dat – skryté korelace mezi proměnnými, testování hypotéz apod.
 Rozhodovací stromy

21
Q

Nástroje pro řízení kvality dat a správu metadat

A

 Zpracování dat s cílem zajištění požadované vlastnosti
 Metadata: data o datech (popis informačních systémů) – datové modely, popisy funkcí, reporty…

22
Q

Základní přístupy k řešení business intelligence

A

Postupné vytváření datových tržišť
Jednorázové vytvoření celého BI řešení
Přírůstkový přístup

23
Q

Postupné vytváření datových tržišť

A

Tvorba nezávislých tržišť pro specifické útvary podniku
 Obsahují všechny potřebné komponenty – relační databázi, OLAP
 Sběrnicová architektura: postupné vylepšení, integračním prostředkem jsou sdílené dimenze
 Principy řešení:
 První tržiště vytvořeno na základní klíčového útvaru – určení sdílené dimenze (např. zákazník) s předpokládaným využitím i pro jiná tržiště
 Další tržiště se vytvářejí s použitím existujících dimenzí a doplněním dalších dimenzí
 Komponenty se vytvářejí v rámci každého tržiště nezávisle na ostatních
 Výhody:
 Maximální rychlost realizování prioritních potřeb
 Krátké intervaly dodávání řešení
 Uchovávání atomických i agregovaných dat
 Jednoduchá tvorba aplikací i dotazů, jednodušší orientace uživatele v aplikacích
 Nevýhody:
 Celková integrace je problematičtější
 Finančně i časově náročný reporting
 Duplicity v jednotlivých komponentách
 Vyšší náklady na provoz

24
Q

Jednorázové vytvoření celého BI řešení

A

 Principy řešení:
 Celková analýza a dokumentace uživatelských požadavků
 Návrh a implementace konsolidovaného datového skladu (podle všech požadavků uživatelů)
 Navazující projekty závislých datových tržišť
 Výhody:
 Flexibilní a integrovaná architektura
 Jednoduchá tvorba dalších datových tržišť
 Minimalizace duplicit
 Možnost použít data díky normalizaci
 Podpora specializovaných datových uložišť (pro mining apod.)
 Nevýhody:
 Řešení trvá déle a je dražší
 Delší dostavení efektů – špatná možnost sledovat návratnost investic do BI
 Riziko změny zdrojových systémů – tyto změny jsou náročné

25
Q

Přírůstkový přístup

A

 Nejmladší a nejpoužívanější přístup
 Principy řešení:
 Souhrn všech požadavků (včetně jejich priorit), návrh architektury a časového harmonogramu
 Identifikace jednotlivých projektů (přírůstků) a jejich návaznosti
 Zahrnuje i způsob financování projektů a algoritmus návratnosti investic
 Vyplňování v časově i finančně omezených krocích
 Každý přírůstek má kompletní řešení
 Výhody:
 Krátký čas dodávaných řešení – rychlé reakce
 Dobrá finanční kontrola nad krátkými projekty
 Nedochází k duplikacím komponent
 Postupné vybudování jednotné a integrované platformy
 Nevýhody:
 Složitost tvorby prvotní koncepce
 Kvůli tomu zdržení v dodávce prvního řešení

26
Q

Principy dimenzionálního modelování

A

 Hlavní úkol: tvorba základní logiky uložení dat tak, aby vyhovovala požadavkům aplikace – tvorba flexibilního datového modelu
 Uplatnění dimenzionálního modelování: prezentace informací jednoduchým způsobem, rychlá odpověď na dotazy, zjišťování relevantních informací¨
 Obsah: vymezení dimenzí (obsahu, hierarchie), určení sledovaných ukazatelů, specifikace vazeb mezi ukazateli a dimenzemi
 Tabulka faktů: tabulka sledovaných hodnot ukazatelů (složené cizí klíče, vlastní umělý primární klíč) – váží se na dimenzionální tabulky, ne na další tabulky faktů
 Dimenzionální tabulky: velké množství atributů textových a diskrétních – pokud se data nemění a jsou konstantní, patří sem

27
Q

Faktové tabulky

A

 Sloupce: klíčové atributy (reprezentují dimenze), hodnoty ukazatelů
 Řádky: jednotlivá měření (odkazy přes cizí klíče – dohromady složený primární klíč)
 Denormalizované údaje: častější ve faktových tabulkách kvůli nižším nárokům na zpracování
 Normalizace: někdy vhodná při množství podobných ukazatelů
 Granularita: závislá na podrobnosti odpovídající dimenze (doporučená co nejvyšší; pozor na transformaci na stejnou granularitu při různých zdrojích)
 Alokace: převedení údajů na stejnou, vyšší granularitu – pokud to není možné, nedoporučuje se kombinace dat s různou granularitou v jedné tabulce
 Typy faktových tabulek:
 Transakční: nejvyšší možná granularita – informace jsou vázány na jednotlivé transakce (hodí se rozdělit časovou dimenzi na den a čas)
 Periodické snímkované: data vstupují v pravidelných úsecích jako souhrny za celý snímek (časový úsek ovlivňuje granularitu a objem dat ve skladu)
 Akumulované: závislé na transakcích, ale aktualizované při změnách stejných věcí
 Data podle agregace:
 Plně aditivní: lze získat smysluplné údaje podle všech užitých dimenzí
 Neaditivní: agregace nemá vůbec smysl (náhrady počtem hodnot, průměrem)
 Semiaditivní: agregace má smysl jen u některých dimenzí (někde se používá průměr apod.)
 Měrné jednotky: výhodnější umístění do faktové tabulky (kvůli případným změnám koeficientů)
 Rozsah: cca 90% celkové kapacity jsou faktové tabulky – snaha omezit jejich rozměr (snižování granularity u starších období)
 Zdroje a kalkulace ukazatelů: aditivní fakta je užitečné ukládat přímo do datového skladu/tržiště (aby se kalkulace nemusely opakovat v jednotlivých aplikacích)
 Faktové tabulky bez ukazatelů: zjišťování počtu událostí (uvedení zboží do akce apod.)

28
Q

Dimenzionální tabulky

A

 Hlavní účel: podnikové číselníky s textovými atributy (popisky)
 Kvalita celého návrhu je často dána kvalitou návrhu dimenzí
 Prvek dimenze: identifikace primárním klíčem (dodržování referenční integrity), ostatní atributy převážně textové a diskrétní
 Prvky patří do dimenzionální tabulky pouze pokud se příliš nemění – v opačném případě do faktové
 Počet dimenzí: k jedné faktové tabulce by se mělo vázat maximálně 15 dimenzionálních (pokud tak není, přechází se ke zjednodušování dimenzí)
 Hierarchie: na základě struktury lze získávat agregované hodnoty ukazatelů:
 STAR: v základní tabulce obsaženy i další nadřízené úrovně v hierarchii (redudance a opakování dat) – rychlejší v odezvě, jednodušší na prohlížení, neefektivní při změnách
Str. 7
 SNOWFLAKE: normalizované provázané tabulky (nízká redudance dat) – vhodné při častých změnách, úspora místa, jednodušší referenční integrita, přehlednější, práce ale složitější
 Referenční dimenze: dimenze, která se k faktové tabulce odvolává přes jinou dimenzionální tabulku (někdy je třeba vytvořit vazební tabulku)
 Degenerované dimenze: dimenze existující pouze v tabulce faktů (např. číslo objednávky, faktury)
 Dimenze parent-child: na úrovni listu pouze jeden záznam, na vyšší úrovni nadřízený s odkazem na onen záznam a tak dále
 Kauzální dimenze: zobrazují příčiny situací a jevů (dopady realizovaných promo akcí na prodej zboží)
 Klíče: doporučené využívání generovaných klíčů
 Nezávislost na změnách ve zdrojových databázích
 Efektivnější konsolidace dat při překrývání klíčů
 Jednodušší řešení, menší nároky na kapacitu
 Výhodnější při změnách v dimenzích
 NULL v klíčích: možnost při OLAPu, doporučení se vyhnout
 Alternativní struktury dimenzí: identifikátory pro více nadřízených struktur, následné rozdílné agregační oprace (často možné u časové dimenze)
 Dimenze času: obvyklé dělení na dvě dimenze (datum, čas dne), generování v patřičném rozsahu do minulosti i budoucnosti – může obsahovat i dodatečné atributy
 Sběrná dimenze: dimenze jen pro různé kombinace příznaků (ušetření místa), možnost využití pro komentování
 Produktová dimenze: informace o prodávaném i nakupovaných zboží s určitou historií, spousta popisných atributů
 Dimenze prodejen: někdy kombinace s teritoriální dimenzí, spousta popisných atributů
 Dimenze měn a další

29
Q

Fáze dimenzionálního modelování

A
  1. Příprava: specifikace priorit podnikových procesů na základně úvodní studie, rekapitulace požadavků a stavu databází
     Návrh architektury: identifikace podnikových procesů – na jejich základě určení dimenzí (matice vztahů) a odvození datových tržišť
     Zdrojové modelování (alternativa): hledání entit a atributů na základě zdrojových systémů
     Cílové modelování (alternativa): návrh skladu a tržišť na základě požadavků, následné zjišťování existence zdrojů
     Sjednocené dimenze: sdílené, vyskytující se ve více datových tržištích – konzistentní klíče, vysoká granularita, identická granularita ve dvou procesech
     Sjednocená akta: jednotné názvy ukazatelů, definice, výpočty, měrné jednotky, vazby na dimenze atd.
  2. Hrubý dimenzionální model: základní přehled dimenzí, ukazatelů, charakteristik, vazeb (ve formě textu, tabulek, schémat) – důležité stanovení granularity
     Charakteristiky dimenze: identifikace dimenze, plný název, obsah, typ (star/snowflake), zdroj dat, hierarchie, atributy
     Charakteristiky ukazatelů: identifikace, plný název, obsahové vymezení, zdroj dat (popř. výpočty), typ, jednotka, možnost agregace, KPI/KGI, vazby na dimenze
  3. Analýza a návrh datové skladu a tržišť: použití nástrojů datového modelování – definování obsahu, vazeb, charakteristik tabulek, ověření dostupnosti a kvality dat
     Konceptuální úroveň: definice základních entit a jejich vazby
     Logická úroveň: transformace entit do návrhů logických struktur včetně atributů
     Fyzická úroveň: specifikace nezbytných technologických charakteristik databázových tabulek a vazeb
  4. Verifikace: otázka, zda řešení odpovídají požadavkům
  5. Kompletační fáze: dokončování zadání pro implementaci
30
Q

Star Schema vs SnowFlake Schema

A

SNOWFLAKE: normalizované provázané tabulky (nízká redudance dat) – vhodné při častých změnách, úspora místa, jednodušší referenční integrita, přehlednější, práce ale složitější
STAR: v základní tabulce obsaženy i další nadřízené úrovně v hierarchii (redudance a opakování dat) – rychlejší v odezvě, jednodušší na prohlížení, neefektivní při změnách

31
Q

Další postupy dimenzionálního modelování

A

 Změny schémat datového skladu/tržiště
 Rozšiřování: přidání nové dimenze, doplnění cizího klíče, definice speciální hodnoty klíče (indikace situace před přidání dimenze)
 Přidání atributu/ukazatele: zbytek dat bude mít u atributu hodnotu NULL, mnohdy se ale v závislosti na granularitu nebo tvorby úplně nového zdroje vyplatí tvorba nové faktové tabulky
 Historizace dat: přehled o vývoji hodnot určitých ukazatelů podle předem určených významných časových okamžiků
 Změny v dimenzích (SCD – Slowly Changing Dimensions): řešení závažného problému změn v dimenzionálních tabulkách (nutnost definovat a realizovat v datové pumpě)
 Změny: přidání/zrušení prvků, změny hodnot atributů, změny ve struktuře
 Uchování historie: přenesení do faktové tabulky, historické tabulky dimenzí
 Typ 1 – Přepis hodnoty atributu: vhodné při opravě chybných hodnot atributů (agregace se automaticky upraví)
 Typ 2 – Přidání řádku: tvorba nového primárního klíče (operační klíč zůstává stejný, pokud existuje) – výhodou je možnost sledovat vývoj historicky
 Typ 3 – Přidání sloupce: větší efektivita výběrů podle obou hodnot (nepoužívá se často)
 Typ 4 – Tvorba historické dimenze: použití v případě častých změn
 Dva nejčastější přístupy: dvě dimenzionální tabulky pro dimenzi s typy 1 a 2, zachování jedné tabulky se složitějšími procedurami ETL
 Kontrola změn: pomocí kontrolních součinů – až poté hledání případné změny
 Analýzy faktů s respektováním změn v dimenzích: nové/rušené produkty, změny názvů, skupin, zařazení
1) Jako v současnosti: přidání nových hodnot, přepsání číselníku, ztráta zrušených prvků
2) Jako v minulosti: přidané hodnoty se neberou v úvahu, názvy zůstávají staré, skupiny také
3) Dynamické sjednocení: přidání sloupce s nezměněným ID, lze dohledat současnost i minulost
4) Statický průnik: pohled na položky, které se neměnily
 Úlohy a příklady dimenzionálního modelování:
 Analýzy zásob: data o zásobách ve třech variantách – periodické časové snímky, transakční záznamy, kumulativní řešení za časové snímky
Str. 9
 Analýzy obchodních transakcí: rozhodování o počtu faktových tabulek (jedna, pro každý typ transakce zvlášť…) podle vazeb tabulek na dimenze, požadavků na analýzy, složitosti
 Analýzy tržního koše: sledování produktů prodávaných společně
 Návrh datového skladu a tržiště vzhledem k realizaci OLAP kostek
 Definování jednoho primárního zdroje
 Definice efektivních datových typů: umělé klíče, numerické položky, časové klíče (int, bigint, float…)
 Definice rozsahu položek, aby bylo možné pojmout i agregace
 Definice indexů dimenzionálních tabulek

32
Q

Příklady dimenzionálního modelování (dimenze)

A

Příklady dimenzionálního modelování
Základní dimenze:
1. Časová
2. Plán, skutečnost
3. Regiony
4. Odvětví ekonomiky
5. Měrné jednotky

33
Q

Příklady dimenzionálního modelování (Závazky, pohledávky)

A

Příklad - Závazky
 Vstup: evidence závazků
 Výstup: analytické finanční databáze
 Zdroje: Db Účetnictví
 Metrika: objem závazků k dodavatelům podniku, objem a podíl závazků po splatnosti
 Dimenze: základní, podniková organizace, ekonomické dimenze
 Klíčové aktivity: analýzy závazků (objem závazků, částky faktur a plateb, obraty, zálohy…), analýzy obratu na účtech dodavatelů (celkové částky plateb a faktur)
Příklad - Pohledávky
 Vstup: evidence pohledávek
 Výstup: analytické finanční databáze
 Zdroje: Db Účetnictví
 Metrika: objem pohledávek za zákazníky podniku, objem a podíl pohledávek po splatnosti
 Dimenze: základní, podniková organizace, ekonomické dimenze
 Klíčové aktivity: analýzy pohledávek (objem pohledávek, obrat na pohledávkovém účtu, platby, nezaplacené faktury…), analýzy salda na odběratele

34
Q

Příklad - Analýzy prodeje zboží a služeb

A

 Vstup: evidence zákazníků, prodeje, ceníky, evidence obchodních příležitostí, dodací a platební podmínky
 Výstup: analýzy prodeje (poptávek, stavu a vývoje objemu prodeje, obchodních příležitostí…)
 Zdroje: Db Prodej, Db Účetnictví, CRM
 Metrika: počet zákazníků podniku (počet nových, ztracených za období), tržní podíl, tržby z prodeje (vývoj, plnení plánů, profitabilita…), náklady na prodej, prodejní marže, dodací lhůta, počet transakcí
Str. 10
 Dimenze: základní, obchodní, podniková organizace, ekonomické dimenze
 Klíčové aktivity: analýzy prodeje (+podle zákazníků, podle prodejců, podle regionů), analýzy cenových vlivů, obchodních příležitostí, poptávek, zisku, úspěšnosti prodávaných produktů…

35
Q

Příklad - Analýzy nákupu materiálů, zboží a služeb

A

 Vstup: evidence nákupu, dodavatelů, dodavatelských cen, skladů a skladových zásob, plány nákupu
 Výstup: analýzy nákupu (analýzy objemu, dodavatelů apod.)
 Zdroje: Db Nákup, Db Účetnictví
 Metrika: objem nákupů, počet reklamací, náklady na nákup, dodací lhůta, nekvalita zboží, počet dodavatelů…
 Dimenze: základní, obchodní, podniková organizace, ekonomické dimenze
 Klíčové aktivity: zpracování matic nákupu, analýzy nákupu a zásob, potencionálních dodavatelů, výběr dodavatelů

36
Q

Příklad - Marketingové analýzy

A

 Vstup: evidence marketingu a marketingových akcí, obchodní příležitosti
 Výstup: marketingové analýzy (potřeby zákazníků, obchodní příležitosti
 Zdroje: Db Marketing, kvalifikovaný odhad, CRM, ERP, Db Účetnictví
 Metrika: pozice podniku na trhu, úspěšnost kampaně, marketingové náklady na objednávku, čas strávený v obchodě, call centra, podíl marketingu na tržbách…
 Dimenze: základní, obchodní, podniková organizace, ekonomické dimenze
 Klíčové aktivity: analýzy potřeb zákazníků (předpokládaný objem prodeje podle zákazníka, teritoria, zboží…), pozice na trhu, hledání příležitostí, analýzy konkurence

37
Q

Příklad - Analýzy skladů

A

 Vstup: evidence skladů a zásob, ceník materiálů, příjemky a výdejky
 Výstup: analýzy pro řízení skladů (skladových zásob, kapacit…)
 Zdroje: Db Sklady, Db Účetnictví
 Metrika: běžná zásoby, dodávkový cyklus, náklady na zásoby, průměrný zásoba, rychlost obratu, počet dní dodávky, poměr zásob k prodeji…
 Dimenze: základní, skladové hospodářství obchodní, podniková organizace, ekonomické dimenze
 Klíčové aktivity: analýzy stavu a vývoje objemu stavových zásob, skladovacích kapacit

38
Q

Příklad - Personální analýzy

A

 Vstup: evidence personální, pracovních míst, osobní údaje pracovníků
 Výstup: personální analýzy (stav a vývoj personálních zdrojů, kvalifikace, bezpečnost práce…)
 Zdroje: Db Personální zdroje, mzdová evidence, evidence získávání pracovníků
 Metrika: počty pracovníků, pracovní fond, lidský kapitál, náklady na nábor (efektivita zdrojů), fluktuace zaměstnanců, objem kurzů a programů, náklady na kurzy
 Dimenze: základní, lidské zdroje podniku a mzdy, podniková organizace, ekonomické dimenze
 Klíčové aktivity: personální analýzy a analýzy rozvoje personálních zdrojů (pracovní síly vzhledem k potřebám, přepokládanému vývoji), analýzy pracovních výkonů, bezpečnosti a zdraví

39
Q

Příklad - Analýzy majetku

A

 Vstup: evidence majetku, investic, oprav a údržby
 Výstup: analýzy majetku (odpisů, údržby, vývoje majetku…)
 Zdroje: Db Majetku, Db Účetnictví
 Metrika: objem majetku, odpisů, investicí, oprav a údržby, úroveň využití
 Dimenze: základní, majetková, podniková organizace, ekonomické dimenze
 Klíčové aktivity: analýzy majetku (využití strojů a zařízení, efektivita, stav), odpisů, investic, oprav a požadavků

40
Q

Příklad - Dopravní analýzy

A

 Vstup: evidence dopravců, vlastních prostředků, požadavků na dopravu, kalkulace nákladů na cesty
 Výstup: dopravní analýzy
 Zdroje: Db Doprava, Db Účetnictví
 Metrika: náklady na dopravu, spolehlivost, včasnost, podíl využití nákladního auta, výkon dopravy
 Dimenze: základní, dopravní, podniková organizace, ekonomické dimenze
 Klíčové aktivity: analýzy vývojových trendů dopravních možností, provázanost s nedůležitějšími dopravními partnery, vyhodnocení podle ekonomických ukazatelů, spotřeba pohonných hmot

41
Q

Projektování BI aplikací

A

 Ovlivněno dalšími faktory: velikost firmy, odvětví, management, sourcing atd.
 Metodiky: určují postup řešení, jednotlivé fáze a obsahovou náplň
 Řešení projektu:
1. Zpracování úvodní studie
2. Specifikace přírůstku řešení
3. Analýza stavu a požadavků na BI
4. Modelování a návrh řešení
5. Návrh technologické platformy přírůstku
6. Návrh transformací dat, ETL
7. Implementace řešení
8. Zavedení do provozu
 Specifické úlohy: tvorba dashboardu, realizace prediktivní analýzy

42
Q

Zpracování úvodní studie BI

A

 Úvodní studie: vyjadřuje celkovou koncepci řešení
 Cíl: zajištění zmapování prostředí pro zasazení BI
 Úkoly: návrh architektury řešení s určením vazeb na ostatní aplikace a základní software – od toho návrh dílčích přírůstků, vzájemných vazeb apod.
 Klíčové aktivity a postup: definování cílů a efektů, tvorba katalogu uživatelů, specifikace požadavků, analýza stavu podniku, funkční specifikace (priority), návrh architektury, outsourcingu a organizace, tvorba harmonogramu

43
Q

Specifikace přírůstku BI řešení

A

 Cíl: tvorba konkrétního zadání pro analýzu a implementaci dalšího přírůstku (rozšíření stávajících BI aplikací)
 Klíčové aktivity a postup: vyhodnocení aktuálního stavu, definování přírůstku (tvorba zadávací dokumentace, identifikace cílové skupiny, sponzorů, efektů, cíle přírůstku), tvorba harmonogramu a ekonomiky

44
Q

Analýza stavu a požadavků na BI

A

 Cíl: posouzení aktuálních uživatelských požadavků, zhodnocení existujících datových zdrojů (kvalita, dostupnost)
 Klíčové aktivity a postup: verifikace uživatelských požadavků, analýza podnikových procesů, specifikace business požadavků, analýza dostupnosti a kvality dat, specifikace změn v produkčních databázích

45
Q

Modelování a návrh řešení

A

 Cíl: návrh datových modelů datového skladu (resp. tržiště) a dalších databázových komponent
 Úkoly: tvorba návrhů aplikací ve formě prototypů
 Klíčové aktivity a postup: dimenzionální modelování, nastavení správy metadat (popis zdrojových systémů, transformačních pravidel, reportů), návrh vrstev řešení (základní obsah dat na úrovni ODS, DWH, DMA), modelování datového skladu, tržišť, OLAP, návrh analytických pravidel, reportů, prototypů

46
Q

Návrh technologické platformy přírůstku

A

 Cíl: specifikace nároků na softwarové a technické zajištění
 Klíčové aktivity a postup: návrh technologické architektury (servery, komunikační infrastruktura), fyzický návrh DWH, DMA a uložení dat, návrh podpory uživatelů, specifikace přístupových práv, návrh komplexního zajištění provozu

47
Q

Návrh transformací dat (ETL/ELT)

A

 Cíl: definice transformačních pravidel mezi produkčními a analytickými daty, zajištění kvality dat a čistící/transformačních procedur
 Klíčové aktivity a postup: specifikace pravidel pro transformace (a zajištění kvality + v různých vrstvách), řešení problémů s chybejícími daty, řešení integritních problémů

48
Q

Self Service BI – PowerPivot

A

 Organizace tabulek: relační způsob (vazby)
 Sloupcově orientované databáze: velké objemy dat (bez omezení excelu) – základní jednotkou jsou sloupce
 DAX: jazyk pro relačně vyjádřená data
 Různé datové zdroje: databáze, excel, internet…
 In-memory: vykonávání dotazů v paměti nad celou databází
 Vztah k Excelu: nenahrazuje kontingenční tabulky – samostatný nástroj (standardní BI systémy ale PowerPivot nenahradí)
 Omezení kontingečních tabulek Excelu: práce pouze s 1 tabulkou, složitější vložení dat, nutnost dílčích dotazů pro dílčí specifické analýzy
 Cíl PowerPivotu: obejít omezení klasické kontingenční tabulky Excelu a vytvořit komplexní datové struktury

49
Q

Self Service BI – QlikView

A

 Přístup do datového modelu z libovolného bodu
 Vysoká flexibilita: zobrazení dat (zelená – vybrané) jen ve vazbách vybraných objektů (bílá – s vazbou)
 In-memory, vysoká komprese dat a možnost exportu do Excelu
 QV dokument: několik listů (různé pohledy na tatáž data, různé informace podle potřeby)
 Slicing & dicing: výběry a prohlížení dat – automaticky na celý datový model, výběr z Listboxů, grafů a provázaných hodnot
 Bookmarking: tvorba značek (CTRL+B)
 Cyclic Groups: seznam dimenzích přepínatelných mezi uživateli
 Drill-down Groups: hierarchický seznam dimenzí
 Kontejnery: alternativní zobrazení různých objektů