VL 4 - Zeitreihenanalyse 1 Flashcards
Was ist in Zeitreihenanalysen (ZRA) dargestellt?
zeitliche Verläufe eines bestimmten Merkmals
Was sind 3 Beispiele für Zeitreihenanalysen?
* monatliche Arbeitslosenzahlen
* Deutscher Aktienindex
* Bevölkerungs- & Einkommensentwicklung
Definition: Zeitreihe
= Folge von Merkmalsausprägungen, die über den Zeitverlauf registriert wird
Was bedeutet es, dass die Zeit als diskrete Variable in einer Zeitreihe dargestellt wird?
= Messung der Variablen erfolgt nicht kontinuierlich, sondern nur zu bestimmten Zeitpunkten
Wie sollten die Zeitpunkte für eine zeitreihenanalytische Auswertung sein?
äquidistant (= gleiche Abstände)
z.B. monatlich, täglich, jede Stunde etc.
Wie viele Datenpunkte benötigen Zeitreihenanalysen?
viele -> mindestens 20-50
Definition: Zeitreihenanalyse (ZRA) (3)
Auswertungsverfahren für Daten im Zeitverlauf
-> Messungen weisen keine Ordnung auf
-> Personen oder andere Merkmalsträger (Wetter, Aktienkurse)
Wie wird eine ZRA zur Beurteilung eines Interventionseffektes verwendet?
eine Intervention wird ebenfalls als Zeitreihe dargestellt (z.B. mit den Werten 0=Baseline & 1= Intervention)
Was sind 5 Ziele der ZRA in der Psychologie?
- Systematik einer Zeitreihe erkennen
- Interventionswirkung beurteilen
- Zusammenfassung der Information bzgl. periodischer Schwankungen zu wenigen Kennwerten
- Interne Struktur identifizieren
- Gegenseitige Beeinflussung zweier Zeitreihen analysieren um Hypothesen über kausale Ursachen-Wirkungs-Richtungen prüfen => multivariate ZRA
Was sind 3 Einsatzgebiete bzw. Arten der ZRA in der Psychologie?
- Univariate ZRA
- Bivariate ZRA
- Multivariate ZRA
Was ist das Einsatzgebiet der univariaten ZRA in der Psychologie?
Entwicklung eines Vorhersagemodells bzgl. der Gesetzmäßigkeit einer Zeitreihe zur Untersuchung der natürlichen (nicht-experimentellen) intraindividuellen Variabilität & Stabilität von Verhalten im zeitlichen Verlauf
Was ist das Einsatzgebiet der bivariaten ZRA in der Psychologie?
= Interventionsanalyse
- Entwicklung eines Interventionsmodells zur Untersuchung der Auswirkungen einer Intervention auf das Verhalten (Klinische Psy. & alle anderen Anwendungsgebiete der Psy.)
Was ist das Einsatzgebiet der multivariaten ZRA in der Psychologie?
Dynamische Interaktionen im Zeitverlauf analysieren um kausale Hypothesen über die Wirkungsrichtung der Beeinflussung zu überprüfen
Was ist eine Voraussetzung der ZRA?
dass die Daten voneinander unabhängig sind
(also dass der Wert einer VP keinen Einfluss auf den Wert der nächsten VP hat)
Weshalb sind “normale” statistische Verfahren für Zeitreihendaten meist nicht angemessen?
Unabhängigkeit eines Wertes von den vorausgehenden Werten ist hier i.d.R. nicht gegeben
=> keine Unabhängigkeit der Fehler
=> serielle Abhängigkeit
Was ist Gegenstand der Analyse in der ZRA?
interne Abhängigkeit der Werte/Daten
Warum wird bei der ZRA die interne Abhängigkeit oft herausgerechnet? (2)
- um mit der bereinigten Zeitreihe weiterarbeiten zu können (“Prewhitening”)
- z.B. könnte man die Daten erst um serielle Effekte bereinigen & dann einen t-Test oder U-Test durchführen, um Interventionsphase mit Baseline zu vergleichen
Was ist serielle Abhängigkeit? (3)
= bei Daten, die im Zeitverlauf gewonnen werden, schwanken die Werte nicht völlig zufällig, sondern aufeinanderfolgende Werte sind sich ähnlicher als zeitlich entfernt liegende Daten
= System hat eine gewisse “Trägheit”
- System hat ein “Gedächtnis”
Was entspricht der ZRA mathematisch gesehen? Was ist eine Besonderheit?
multiple Regression
-> die Prädiktorvariablen sind ebenfalls Zeitreihen
Um welche Frage geht es bei der ZRA?
ob & wie sich die Systematik der Werte bzw. die Veränderung von Werten im Zeitverlauf beschreiben & vorhersagen lässt
Welche Arten von Prädiktoren werden eingesetzt bei der ZRA? (3)
- Prädiktoren, die auf der Zeit (t) beruhen
- Prädiktoren, die sich das der Zeitreihe selbst ergeben (autoregressive Effekte, Moving Average)
- eine andere Zeitreihe
Was sind Prädiktoren, die auf der Zeit (t) beruhen bei der ZRA?
- z.B. linearer Trend
- Prädiktor: periodische Schwankungen, z.B. Tages-, Wochen- oder Jahresperiodik oder Sinusfunktion
=> hier lässt sich ein großer Varianzanteil dieser Zeitreihe durch eine periodische Funktion beschreiben -> lässt sich ebenfalls als Funktion der Zeit ausdrücken
Was sind autoregressive Effekte?
vorherige Werte der Zeitreihe beeinflussen den aktuellen Wert
Wann spricht man von der Ordnung des autoregressiven Effektes?
je nachdem, wie viele Werte einen direkten Einfluss haben z.B. wenn 2 vorhergehende Zeitpunkte einen direkten Einfluss haben => autoregressiver Effekt 2. Ordnung (AR-2)
Was meint “Moving Average”?
= vorherige “Fehler” beeinflussen den aktuellen Wert
Wann spricht man von der Ordnung des Moving Average Effektes?
je nachdem, wie viele vorherige Fehler einen direkten Einfluss haben, spricht man von der Ordnung des Moving Average Effektes
z.B. wenn 2 vorhergehende Fehler einen direkten Einfluss haben => Moving Average Effekt 2. Ordnung (MA-2)
Was meint “Autoregression”?
= dass man die zeitverschobene Zeitreihe (Lag-Zeitreihe) als Prädiktor verwendet
Was soll bei der Autoregression vorhergesagt werden? Beispiele (4)?
= jeder Wert soll aus dem vorhergehenden Wert derselben Variable vorhergesagt werden
z.B. “Kann man die Stimmung an einem Tag durch die Stimmung am Vortag vorhersagen?”
z.B. “Lässt sich das Wetter aus dem Wetter am Vortag vorhersagen?”
z.B. “Lässt sich der Aktienkurs jetzt aus dem Aktienkurs von vor einer Stunde vorhersagen?”
z.B. “Lässt sich der aktuelle Blutdruck durch den Blutdruck vor einer Minute vorhersagen?”
Was meint eine Lag-1-Reihe?
Zeitreihe wird um einen Wert verschoben
Was meint die Autoregression erster Ordnung in Bezug auf Zeitreihe X?
= Zusammenhang/Korrelation zwischen Zeitreihe X & lag-1-Zeitreihe
Was meint eine Lag-2-Reihe?
ursprüngliche Zeitreihe wird um 2 Werte verschoben: Autoregression 2. Ordnung
Definition: lag (ZRA)
= dt.: Verschiebung
= gibt an, um wie viele Zeitabschnitte eine Zeitreihe verschoben wurde
Wie lassen sich Autokorrelationen zunehmender Ordnung darstellen & auf Signifikanz prüfen?
als Tabelle oder Grafik
Was meint der indirekte Einfluss der Ordnung der Autoregression?
= der Einfluss eines früheren Zeitpunktes (z.B. t-2) kommt nur dadurch zustande, dass dieser mit t-1 zusammenhängt und t-1 wiederum mit t
Was meint der direkte Einfluss der Ordnung der Autoregression?
= über den Einfluss von t-1 hinaus hat t-2 auch noch einen eigenständigen Einfluss auf t
Kann man einer Grafik der Autokorrelationen entnehmen, welche Ordnung der autoregressive Prozess hat?
lässt sich dort kaum absehen -> man benötigt die Partial-Autokorrelationen
Was wird bei der Partialkorrelation zu lag 2 auspartialisiert? Wieso?
Korrelation mit lag1 wird auspartialisiert -> Bleibt noch eine Korrelation mit lag 0 übrig?
Was wird bei der Partial-Autokorrelation zu lag 3 auspartialisiert?
die beiden dazwischenliegenden lags
Was meint der “Zufallsschock” in der ZRA?
= Zufallskomponente, die die Ausprägung der Zufallsvariablen beeinflusst
Was sind 2 Merkmale des “Zufallsschocks” der ZRA?
- komplett zufällig
(im Gegensatz zur Zufallsvariablen y, die auch systematische Anteile enthält) - entspricht dem “Fehler” in herkömmlichen Regressionsmodellen
Woraus besteht “white noise”?
nur aus Zufallsschocks, die nur zum jeweiligen Zeitpunkt wirken
Woraus setzt sich die Ausprägung der Zufallsvariablen zusammen?
= aktueller Zufallsschock
+ ggf. Einfluss früherer Zustände (AR) oder früherer Zufallsschocks (MA)
+ + ggf. Trend
+ + ggf. Einflüsse anderer Variablen
Woraus besteht der direkte Einfluss des “Moving Average” im Gegensatz zu einem autoregressiven Effekt?
hier besteht der direkte Einfluss nicht zwischen dem vorherigen Wert & dem aktuellen Wert, sondern zwischen dem vorherigen FEHLER & dem aktuellen Wert
Können Autoregression & Moving-Average auch gemeinsam auftreten?
Ja
Was wird i.d.R. verwendet, um ein passendes Modell für die Zeitreihe zu finden?
mehrere Prädiktoren (multiple Regression)
Was kann man auch anhand der Autokorrelation beurteilen?
periodische Schwankungen
Was sind 4 Voraussetzungen für die Anwendung der ZRA?
- Ausreichende Anzahl an Datenpunkten
- Äquidistante Zeitmessung
- Intervallskalierte AV
- Stationarität
Wann liegt “Mittelwertsstationarität” vor?
wenn der Erwartungswert unabhängig vom Zeitpunkt ist
Wann ist “Mittelwertsstationarität” NICHT gegeben?
wenn die Zeitreihe einen Trend enthält (linear, polynom höherer Ordnung oder periodisch)
Was ist meist der 1. Schritt der ZRA?
Stationarität herstellen
(da Voraussetzung vieler Verfahren der ZRA)
Wann liegt “Varianzstationarität” vor?
wenn die Varianz über die Zeit etwa gleich bleibt, d.h. der Erwartungswert der Varianz ist unabhängig vom Zeitpunkt
Beispiel, bei dem Varianzstationarität NICHT gegeben ist
z.B. am Anfang der Messungen ist die Stimmung sehr variabel, in der zweiten Hälfte der Messungen ist die Stimmung ausgeglichen
Was ist der “White-Noise-Prozess”?
= Zufallsprozess : der Wert zu jedem Zeitpunkt ist unabhängig von den Werten anderer Zeitpunkte oder anderer Variablen
==> zu jedem Zeitpunkt ist die Ausprägung der Variablen nur vom Zufall abhängig
Was ist bei “White Noise” für jeden Zeitabschnitt alles gleich? (3)
- Verteilung
- Erwartungswerte
- Varianz
der Zufallsvariablen
Was für eine Art Prozess ist White Noise?
stochastisch
Als was dient White Noise?
als Modell, mit dem eine systematische Zeitreihe verglichen wird
z.B. “Bleibt tatsächlich white noise übrig, wenn bestimmte Systematiken entfernt wurden?”
Was meint “Prewhitening” (Vorwäsche)?
= serielle Abhängigkeit wird aus einer Zeitreihe entfernt, indem Trends, AR-Prozesse & MA-Prozesse eliminiert werden
Was ist ein Vorteil des “Prewhitening” ?
Residuen der Regression sind dann frei von serieller Abhängigkeit
& können dann auch mit anderen statistischen Verfahren bearbeitet werden (= Voraussetzung der Unabhängigkeit von Fehlern ist dann gegeben)
Was ist ein stochastischer Prozess?
= zeitliche Abfolge von Zufallsvariablen & liefert das theoretische Modell für die empirische Zeitreihe
Wie hängen ZRA & stochastische Prozesse zusammen? (2)
In der ZRA wird von der empirischen Zeitreihe auf den zugrunde liegenden stochastischen Prozess geschlossen
=> Ziel der ZRA: Modell des stochastischen Prozesses finden
Was versucht die ZRA herauszufinden?
welcher stochastische Prozess die vorliegende Zeitreihe erzeugt haben kann
Was ist die AV der ZRA?
Zufallsvariable
= Zufallsschock + systematische Effekte
Was ist die Grundgesamtheit der ZRA?
stochastischer Prozess
Was ist der “Fehler” der ZRA?
Zufallsschock
Was liefert die Datenerhebung in der ZRA?
Zeitreihe
Was ist das Ziel der ZRA?
Eigenschaften des stochastischen Prozesses identifizieren (z.B. Ordnung des ARIMA-Modells)
=> die in den Daten erhaltenen Information in verschiedene Bestandteile zu zerlegen bzw. ein MODELL zu finden, das die Daten möglichst gut beschreibt
Was ist die AV in der Inferenzstatistik ?
Zufallsvariable =
Zufall (=Fehler) + systematische Effekte
Was ist die Grundgesamtheit in der Inferenzstatistik ?
Population
Was ist der “Fehler” in der Inferenzstatistik ?
Fehler
Wer oder was liefert die Datenerhebung in der Inferenzstatistik ?
Stichprobe
Was ist das Ziel in der Inferenzstatistik ?
Eigenschaften der Population erkennen
(z.B. Mittelwert, Varianz, Verteilungsform etc.)
Was wird in der ZRA unterschieden?
interne Struktur der Daten (z.B. Trend, Autoregression) & Zusammenhang mit einer anderen Variable
Was ist oftmals die Elimination von z.B. einer Autoregression nur?
Vorbereitung für weitere Analyseschritte (z.B. Regression mit einer Interventionsvariablen)
Was kann der Zusammenhang mit einer anderen Variablen z.B. abbilden?
die Interventionswirkung