MAS 4. Flashcards

1
Q

Modelovanie vstupných dát
Model vstupných dát

A

Modelujeme dáta v modelovanom systéme, ktoré
vstupujú do simulačného modelu
- Od kvality modelovania vstupných konkrétnych dát
závisia výsledky modelu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vstupné dáta
Spôsoby modelovania vstupnej veličiny

A

- Spôsoby modelovania vstupnej veličiny:
* Deterministicky
- Niektoré veličiny sú deterministické
(počet operátorov)
- Pozor na modelovanie stochastických
veličín deterministicky (príchod
zákazníkov do banky)
* Stochasticky
- Stochastické veličiny sú veľmi časté (čas
obsluhy, príchod zákazníkov, časy medzi
poruchami)
-Náhodná premenná (využitie rozdelenia
pravdepodobnosti)

f

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Tvorba modelu vstupných dát

A
  1. Získanie dát z modelovaného systému
  2. Výber vhodného spôsobu modelovania dát
  3. Vytvorenie modelu dát
  4. Overenie vytvoreného modelu dát
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Zber dát

A
  • Najnáročnejšia časť modelovania vstupných dát
  • Ako získať dáta:
  • Zber dát priamo za účelom tvorby simulačného
    modelu - výhodnejšie
  • Využitie existujúcich (už zozbieraných dát) –
    lacnejšie
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Priamy zber dát

A
  • Plánovanie
  • Zozbierajte 100-200 pozorovaní (vzoriek)
  • Zachovajte dostatočnú presnosť
  • Zozbierajte vzorky z rôznych častí dňa, týždňa - ak
    je predpoklad variability
  • Testujte nezávislosť vzoriek dát - korelácia
  • Spájajte homogénne vzorky dát (vhodné otestovať -
    Kruskalov-Wallisov test)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Využitie existujúcich dát

A
  • Dáta nemusia byť usporiadané podľa poradia zberu
  • Dáta môžu byť združené do skupín
  • Dáta nemusia mať požadovanú presnosť
  • Môžu byť obsiahnuté chybné dáta
  • Dáta môžu obsahovať viac združených veličín
    (doba opravy stroja závisí od druhu práce - oprava,
    údržba)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Použitie dát
Priame využitie dát v simulácií

A
  • Dáta reprezentujú minulosť systému, môžu byť
    odhadom jeho budúcnosti (pri zachovaní rovnakých
    podmienok)
  • Vyskytujú sa len namerané hodnoty
  • Nedostatok dát na dlhšie behy
  • Môže byť pomalé - načítavanie veľkého množstva
    dát
  • Vhodné pre validáciu modelu
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Empirické rozdelenie pravdepodobnosti

A

Diskrétne - len namerané hodnoty
- Spojité - aproximácia
- Vhodné ak nie je možné nájsť teoretické rozdelenie
pravdepodobnosti
- Sú ohraničené (len nameraný rozsah hodnôt)
- Kvalita je úplne závislá od kvality vzoriek
- Nepresné pri malom množstve dát

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Štatistické (teoretické) rozdelenie
pravdepodobnosti

A
  • Diskrétne, spojité
  • Vyhladenie nameraných vzoriek
  • Poskytuje aj hodnoty mimo nameraného rozsahu
  • Možnosť jednoducho meniť parametre - stredná
    doba medzi príchodmi
  • Kompaktnejšie ako empirické rozdelenie -
    nepotrebujeme evidovať tabuľky
  • Nie vždy sa dá nájsť vhodné rozdelenie
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Tvorba modelu s využitím
teoretického rozdelenia
pravdepodobnosti
(Kroky)

A
  • Kroky:
    1. Test nezávislosti dát
    2. Výber vhodného rozdelenia
    3. Zistenie parametrov
    4. Testovanie zvoleného rozdelenia
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Test nezávislosti

A

Mnohé štatistické metódy (napr. chi-kvadrat test)
predpokladajú, že dáta sú nezávislé a rovnako
rozdelené (pochádzajú z rovnakého rozdelenia) –
IID (Independent & Identically Distributed)
Je potrebné testovať, napr.
* Scatter plot
- X-ová súradnica = hodnota x_i
- Y-ová súradnica = hodnota x_i+1
Ak sa body ukladajú po diagonále - dáta
sú závislé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Výber vhodného rozdelenia

A
  • Vyberáme na základe:
  • Teoretických znalostí - napr. príchod
    zákazníkov je Poissonov proces
  • Číselných charakteristík - napr. koeficient
    rozptylu, šikmosť, špicatosť
  • Rozsahu hodnôt (ohraničenie) - napr. doba
    obsluhy nadobúda iba kladné hodnoty
  • Eyeballing (od oka) - na základe histogramu
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Zistenie parametrov rozdelenia

A
  • Štatistické metódy odhadov parametrov
  • Odhady strednej hodnoty a rozptylu vzorky
  • Metóda momentov
  • Metóda maximálnej vierohodnosti
  • Využitie špecializovaného softvéru
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Nedostatok dát

A
  • Ak dáta nie sú k dispozícií:
  • Snažím sa to odhadnúť
  • Využitie existujúceho modelu podobného
    procesu
  • Typ procesu: napr. na príchod zákazníkov dám
    Poissonove RP
  • Názory expertov: napr. ak poznám min a max
    => rovnomerné, ak poznám aj modus =>
    trojuholníkové, ak poznám aj strednú hodnotu
    => beta
  • Môžem urobiť len tam, kde dáta nie sú citlivé
  • Analýza citlivosti - ak malé zmeny vstupov
    spôsobia veľké zmeny výsledku => dáta sú veľmi
    citlivé
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Multimodálne procesy

A
  • Rozdelím na viacero častí, ktoré analyzujem
    samostatne
  • Viem aký podiel je v jednotlivých častiach - ak
    generujem, tak najprv určím o aký typ ide a až
    potom generujem z rozdelenia
  • Multimodálne - “viac modusov”
  • Telefonické hovory - rôzne povahy volajúcich
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Nestacionárne procesy

A
  • Proces počas svojho behu mení svoje štatistiky
  • Napr. počet zákazníkov prichádzajúcich do
    reštaurácie sa mení počas dňa
  • Nesmieme zanedbať, musíme rozdeliť na intervaly,
    v ktorých sa dá intenzita príchodu považovať za
    konštantnú a určiť intenzitu pre každý interval
    samostatne