VL 5 - Zeitreihenanalyse 2 Flashcards
Wofür steht ARIMA-Modell?
- AR = Autoregressive
- I = Integration (Trend)
- MA = Moving Average
Was soll mithilfe der 3 Bestandteile des ARIMA-Modells gemacht werden? (2)
- der der Zeitreihe zugrundeliegender stochastischer Prozess soll identifiziert/modelliert werden
- ODER diese 3 Bestandteile werden aus der Zeitreihe eliminiert, um dann weitere Analysen vorzunehmen (z.B. den Zusammenhang mit einer anderen Variablen zu prüfen)
Wofür steht p in ARIMA (p,d,q)?
p: Ordnung des autoregressiven Prozesses
Wofür steht d in ARIMA (p,d,q)?
d: Anzahl der Differenzierungen, die nötig sind, um Stationarität zu erreichen
Wofür steht q in ARIMA (p,d,q)?
q: Ordnung des moving-average Prozesses
Was berücksichtigt ARIMA (p,d,q) auch noch?
periodische Prozesse
(in Autoregression, Trend & Moving Average)
Was ist der 1. Schritt der Datenanalyse beim ARIMA Modell?
I: Integration = Trendbereinigung
Wodurch wird Stationarität im ersten Schritt der Datenanalyse, Integration, erreicht?
dass Differenzen zwischen aufeinanderfolgenden Werten gebildet werden (ggf. mehrfach)
Warum ist die Trendbereinigung (Integration) der erste Schritt der ZRA?
da ein vorhandener Trend die Identifikation der anderen Bestandteile erschwert/ verhindert bzw. zu Fehlinterpretationen führen kann
Was beschreiben autoregressive Prozesse?
= den Einfluss, den ein früherer Zustand auf den aktuellen Zustand hat
Wie wird die Autokorrelationsfunktion (ACF) dargestellt? (3)
- Darstellung der Autokorrelationen über verschiedene Lags
- Darstellung als Tabelle und/oder Diagramm
- mit Signifikanzgrenzen/Konfidenzintervall (abhängig von n)
Was ist die Partialautokorrelationsfunktion (PACF)?
Korrelationen der Zeitreihe mit der um X viele Lags verschobenen Zeitreihe, bereinigt um den Einfluss dazwischenliegender Zeitpunkte
Woran erkennt man einen AR-Prozess der Ordnung p?
daran, dass die ACF rasch abschwingt & die PACF abrupt nach p Lags abbricht
Woran kann man die Ordnung des AR-Prozesses erkennen?
an der PACF (Partialautokorrelationsfunktion)
Wie verhält sich die PACF im AR (p) Prozess?
PACF bricht nach p Lags ab
Was ist der Mittelwert & die Streuung der Regressionsgleichung der AR-Komponente?
z-Werte -> Mittelwert= 0 & Streuung= 1
Wie heißt der Regressionskoeffizient für den AR-Anteil?
phi (Φ)
Wie sind die Korrelationen in einer realen Zeitreihe?
normalerweise nicht 0
Welche 4 verschiedenen Statistiken gibt es, die einen Anhaltspunkt geben, ob eine Korrelation als Null zu bewerten ist (AR-Prozesse: Modelldiagnose)?
- Signifikanzgrenzen
- Konfidenzintervall
- Standardfehler
- Box-Ljung Statistik
Was bedeutet es wenn ein AR-Prozess vorliegt?
dass Wert bzw. Zustand zu einem Zeitpunkt den bzw. die nachfolgenden Werte beeinflusst
Beispiel, für eine psychologische Variable für die ein AR-Prozess plausibel ist
Bsp.: Stimmung, diese wird von der
1) Stimmung gestern (zt-1) &
2) aktuellen Zufallseinflüssen (at) bestimmt
Was charakterisiert den “Moving Average Prozess”?
der Wert zu einem Zeitpunkt wird nicht vom vorherigen Zustand, sondern dem vorherigen “Zufallsschock” beeinflusst
Wie lautet der Regressionskoeffizient/ Gewichtungskoeffizient für Moving Average-Anteile?
theta (θ)
Woran erkannt man einen MA-q-Prozess?
dass die ACF nach q lags abbricht & die PACF ausschwingt
(umgekehrt zu den AR-Prozessen)
Beispiel für eine psychologische Variable als MA-Prozess
Bsp.: Stimmung: aktuelle Stimmung wird von vorherigen sowie dem aktuellen “Zufallseinfluss” (at) bestimmt
Was sind Zufallseinflüsse (=Zufallsschocks) im ZRA?
alles, was sich nicht vorhersagen lässt: alles außer Trend (linear, periodisch), AR- & MA-Prozessen
Inwieweit lassen sich AR- und MA-Prozesse ineinander überführen?
AR-Prozess: der vergangene Wert entsteht durch die vielen vorangegangenen Zufallsschocks
Wie kann man gemischte Prozesse (AR- & MA-Prozesse) identifizieren?
relativ schwierig -> oft muss man verschiedene Modelle “ausprobieren” & miteinander vergleichen
=> Güte der Modelle anhand Modellgütekriterien bewerten (Modellpassung vs. Sparsamkeit)
Identifikationshilfen für ARMA-Modelle: Wie ist der Trend der Funktion ACF?
sinkt nicht rasch ab
Identifikationshilfen für ARMA-Modelle: Wie ist der white noise der Funktion ACF?
für alle lags: null (also nicht signifikant)
Identifikationshilfen für ARMA-Modelle: Wie ist der Misch-Prozess der Funktion ACF?
für alle lags k > p-q: gedämpfte exponentielle bzw. Sinusschwingung
Identifikationshilfen für ARMA-Modelle: Wie ist der white noise der Funktion PACF?
für alle lags: null (also nicht signifikant)
Identifikationshilfen für ARMA-Modelle: Wie ist der Misch-Prozess der Funktion PACF?
für alle lag k > p-q: gedämpfte exponentielle bzw. Sinusschwingung
Was sind 2 generelle Anforderungen für ein ARMA-Modell?
- Modell sollte möglichst sparsam sein (möglichst wenige Parameter enthalten)
- Modell sollte möglichst viel Varianz in den Daten erklären bzw. die Residualvarianz möglichst klein sein
=> Modellgütekriterien dafür (z.B. AIC)
Was macht man wenn die Zeitreihe deutliche periodische Anteile enthält?
Spezifikation eines ARIMA (p,d,q) (P,D,Q) Modells, wobei dieses die jeweiligen periodischen Anteile, ebenfalls aufgeschlüsselt nach Trend, AR & MA-Komponente enthält (erkennt man an einem entsprechenden Muster in ACF & PACF)
Was ist wichtig bzgl. der Residuen bei saisonalen/periodischen Anteilen?
sollten white noise sein, d.h. keine Systematik mehr aufweisen
Wann ist die Periodik in den Residuen noch sichtbar?
wenn diese nicht im Modell berücksichtigt wurde
Was sind die 5 Schritte des Ablaufs der ZRA nach dem ARIMA-Modell?
- Trendbereinigung
- Identifikation der Ordnung von AR- & MA-Prozess
- Schätzung der Modellparameter (Kleinste-Quadrate-Kriterium oder Maximum-Likelihood-Verfahren)
- Berechnung der Modellgütekennwerte + Residuen & Überprüfung auf “white noise” (ACF & PACF)
- evtl. anderes Modell oder Vergleich mehrerer Modelle
Wieso ist die Beschreibung einer Zeitreihe durch ein ARIMA-Modell für sich genommen belanglos?
geschätzte Parameter können meist nicht sinnvoll interpretiert werden
Wofür dient das ARIMA-Modell bzw. die Residuen als Ausgangspunkt?
(3)
- Vorhersage
- Überprüfung einer Interventionswirkung (= Interventionsanalyse)
- Analyse des Zusammenhangs mit einer/mehreren weiteren Variablen (multivariate Modelle)
Was sind die 4 Schritte des Ablaufs einer ZRA?
- Identifikation eines angemessenen ARIMA-Modells
- Schätzung der Modellparameter
-
Modelldiagnose: Eignet sich Modell zur Beschreibung der Zeitreihe?
-> WENN JA: - Überprüfung der Veränderungshypothese: Vorhersage, Interventionseffekte, Zusammenhänge mit anderen Zeitreihen
Wie funktioniert die Interventionsanalyse? (5)
- ARIMA-Modell anhand Baseline-Daten entwickeln
- Passt das Modell auch für die Interventionsphase?
- Intervention wird binär kodiert
- Nacheinander o. gleichzeitig wird ARIMA-Prozess & Interventionszeitreihe als Prädiktoren in Modell aufgenommen
- Kann die Interventionszeitreihe zusätzliche Varianz erklären?
Wie wird die Intervention i.d.R. abgebildet?
binär im Zeitverlauf (0= Baseline, 1= Intervention)
Welche 3 unterschiedlichen Arten von Interventionen gibt es?
- einmalige Intervention (“Puls-Input”)
- wiederholte Interventionen
- dauerhafte Interventionen (“Stufen-Input”)
Je genauer die erwartete Wirkung im Voraus (!) spezifiziert werden kann,…
umso präzisere Tests einer Interventionsphase sind möglich
Wodurch wird die Wirkung der Intervention im Modell abgebildet?
durch eine Transferfunktion
Was beschreibt die Transferfunktion?
beschreibt die erwartete Wirkung der Intervention
Was sind 7 Interventionseffekte in ZRA?
- Abrupte Niveauänderung
- Verzögerte Niveauänderung
- Temporäre Niveauänderung
- Abrupte Richtungsänderung
- Verzögerte Richtungsänderung
- Abrupte Variabilitätsänderung
- Kompensatorische Änderung
Was wird in einer Transferfunktion spezifiziert?
wie eine Input-Zeitreihe eine Output-Zeitreihe beeinflusst
Was kann bei einer einfachen Intervention in Form eines “Stufeninput” (Input-Zeitreihe) modelliert werden?
unterschiedliche “Wirkungen” der Intervention auf das Verhalten (z.B. Stimmung = Output-Zeitreihe), z.B. eine verzögerte oder temporäre Wirkung
Was ist die Transferfunktion im Rahmen der Interventionsanalyse also?
“Filter”, mit dem die Intervention als Inputvariable auf den Output wirkt
Welche Variable wird bei einer multivariaten ZRA als Prädiktor verwendet?
eine andere, i.d.R. metrische Variable
Was kann die multivariate ZRA (Transferfunktionsmodell) berücksichtigen?
nicht nur gleichzeitige, sondern auch verzögerte Wirkungen der Prädiktorzeitreihe
Was wird noch zusätzlich in der multivariaten ZRA (Transferfunktionsmodelle) berechnet?
Kreuzkorrelationen (CCF= Kreuzkorrelaionsfunktion) über verschiedene Lags
Auf was lassen sich aus der Struktur der Kreuzkorrelationen in der multivariaten ZRA (Transferfunktionsmodelle) Rückschlüsse ziehen?
auf kausale Wirkmechanismen
Was bedeutet es z.B. wenn die Korrelationen der analysierten Zeitreihe mit den vorhergehenden Lags der anderen Zeitreihe (positive Lags) kleiner ist als mit den zukünftigen (negative Lags)?
zeitliche Ordnung: die untersuchte Zeitreihe beeinflusst die andere Zeitreihe (und nicht umgekehrt)