10. Laiko eilučių prognozavimas Flashcards
Laiko eilutės dekompozicija išskaido dinamiką į komponentus - į kokius?
- trendo komponentas (level, trend):
* ilgalaikis augimas arba kritimas, kryptis - sezoninis komponentas (seasonal):
* periodiškumas (ketvirčio, mėnesio, savaitės dienos)
* įmanomas vienkartinis metuose (pagal švenčių dienas) - cikliškumas (verslo arba ekonomikos):
* nefiksuoto periodo pasikartojimai
* periodo ilgis paprastai ilgesnis nei sezoniškume
* eilutės reikšmė keičiasi stipriau nei sezoniškume - klaidos komponentas – liekanos (error, residual):
* nesumodeliuoti, nepaaiškinami svyravimai
* tai ko nepavyksta sumodeliuoti trendu ir sezoniškumu
* nusezoninta (de-seasonalized) eilutė = trendas + liekanos
Kokius paprastus vienmačių laiko eilučių prognozavimo metodus žinote?
Paprasti metodai: vidurkis, naivus, sezon-naivus, naivus su drift’u.
Kokius sudėtingus vienmačių laiko eilučių prognozavimo metodus žinote?
- Regresijos: tiesinis/kvadratinis trendas, sezoniniai dummy
- Autoregresinis (AR) – istorinė dinamika (Y vėlavimai) įtraukiama į dešinę pusę.
- Autoregresinis integruotas slenkantis vidurkis (ARIMA)
- Theta modelis – eksponentinis glodinimas su drift’u
- ETS – eksponentinio glodinimo generalizacija
- BATS – ARMA ir eksponentinio glodinimo hibridas – sudėtingam sezoniškumui
- Naujas modelis – Prophet
- Forecasting with temporal hierarchies
- X-12 ARIMA dekompozicija
- STL (seasonal trend Loess) dekompozicija - adityvi , bet po logaritminės transformacijos multiplikatyvi
- eksponentinio glodinimo generalizacija (ETS)
- StructuralTS – (tiesinis Gauso) būsenų erdvės modelis (level apribota ARIMA(0,1,1); trend apribota ARIMA(0,2,2);
BSM ––(basic structural model) lokalus trendas su sezoniškumu
Kokie yra pagrindiniai laiko eilučių prognozavimo klaidų variantai?
- RMSE (root mean square error): šaknis iš vidutinės kvadratinės paklaidos.
- MAPE (mean absolute percentage error): absoliučių paklaidų, išreikštų procentais, vidurkis.
- MASE (mean absolute scaled error) = [0..1..∞]
Kada labiau tinka naudoti MAPE arba MASE prognozavimo klaidą vietoje RMSE? Kuo MASE pranašesnė už MAPE?
RMSE: Privalumas – kvadratas „baudžia“ dideles klaidas
Trūkumas – negalima palyginti skirtingų dalykų (MAPE ir MASE galima palyginti, tada naudingiau juos naudoti)
MAPE: Privalumas – tinka lyginti skirtingoms prognozėms
Trūkumas – netinka, kai arti 0 → SMAPE, MAAPE; teikia didesnį svorį didesnių reikšmių klaidoms
MASE: Privalumas – tinka palyginti skirtingų modelių prognozavimo klaidas; nereikalauja, kad faktinės reikšmės būtų
didesnės už nulį, todėl jis gali būti pritaikytas plačiau negu MAPE.