Zeitreihenanalyse 1 Flashcards

1
Q

Was ist die Zeitreihenanalyse?

A

Eine Analyse, mit der wir Daten analysieren und Trends aufdecken können. Die Daten sollen stündig, täglich, wöchentlich, monatlich oder jährlich gesammelt werden (äquidistant - sollen gleiche Abstände haben)

  • Keine kontinuierliche Sammlung von Daten, sondern auf bestimmte Zeitpunkte
  • Zeitliche Verläufe eines bestimmten Merkmals
  • Zeitreihenanalyse benötigt viele Datenpunkte, mindestens 20-50
  • Daten können sich auf Personen oder andere Merkmalsträger beziehen

Beispiel: Monatliche Arbeitslosenzahlen in Deutschland seit 2010

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Können bei ZRA pro Zeiteinheit mehr als eine Variable betrachtet werden?

A

Ja, man kann entweder nur eine Variable (univariate ZRA) pro Zeiteinheit messen oder mehrere (bivariate/multivariate ZRA)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was sind die zwei Fragen, auf die die ZRA eine Antwort geben kann?

A

1) Hat die Intervention zu einer Veränderung geführt, wenn ja, wie groß/stark ist diese?
- Differenz vorher-nachher
- Statistische Signifikanz
- Effektgrößen

2) Ist die Veränderung auf die Intervention zurückzuführen?
- Frage nach der internen Validität
- Wird nicht mit der Auswertung der Daten festgestellt, sondern muss man ein passendes/gutes Design auswählen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie werden die Baseline- und Interventionswerten bei ZRA dargestellt?

A

Baseline = 0
Intervention = 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was sind die Ziele der ZRA?

A
  • Erkennen der Systematik einer Zeitreihe, um dann eine Intervention abzuleiten
  • Beurteilung einer Interventionswirkung: Ändert sich das Verhalten nach Einsetzung der Intervention?
  • Zusammenfassung der Information bezüglich periodischer Schwankungen zu wenigen Kennwerten, die weiter verrechnet werden
  • Identifikation der internen Struktur der Zeitreihe, um diese zu eliminieren, damit später andere statistische Verfahren angewendet werden können
  • Analyse der gegenseitigen Beeinflussung zweier Zeitreihen, um Hypothesen über kausale Ursache-Wirkungs-Richtungen zu prüfen –> Multivariate ZRA
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist der Einsatzgebiet der univariaten Zeitreihenanalyse?

A
  • Entwicklung eines Vorhersagemodells zur Untersuchung der natürlichen inra-individuellen Variabilität und Stabilität von Verhalten im zeitlichen Verlauf (Vorhersage, Daten, Trends, Muster oder zyklisches Verhalten)
  • Keine Manipulation, nur Beobachtung
  • Hier gibt es keine Intervention –> nicht-experimentell
  • Wir können messen, ob eine serielle Abhängigkeit vorhanden ist (dann können wir sie eliminieren, um andere Verfahren einsetzen zu können)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist der Einsatzgebiet der bivariaten Zeitreihenanalyse (Interventionsanalyse)?

A
  • Entwicklung eines Interventionsmodells zur Untersuchung der Auswirkungen einer Intervention auf das Verhalten. Untersuchung von zwei Variablen und wie sie im Laufe der Zeit sich verändern (Korrelation, Kausalschlüsse)
  • Wie bewirkt eine Intervention auf das Verhalten der Person
  • Benutzt in klinischer Psychologie und anwendungspsychologie
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist der Einsatzgebiet der multivariaten Zeitreihenanalyse?

A
  • Analyse dynamischer Interaktionen im Zeitverlauf zur Überprüfung kausaler Hypothesen über die Wirkungsrichtung der Beeinflussung (zeitliche Richtung der Beeinflussung von mehreren Variablen)
  • Untersuchung von Zusammenhängen und Kausalität zwischen Variablen
  • Hier haben wir mehrere ZRA gleichzeitig
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist der Unterschied zwischen ZRA und anderen statistischen Verfahren?

A
  • Abfolge der Variablen: Bei den anderen statistischen Verfahren ist die Reihenfolge der einzelnen Werte unwichtig. Bei ZRA ist aber das genau sehr wichtig
  • Die Voraussetzung bei normalen Verfahren ist, dass die Daten voneinander unabhängig sind und der Wert einer Vp keinen Einfluss auf den Wert der nächsten hat –> Bei ZRA aber nicht
  • Abhängigkeit der Werte: Die Unabhängigkeit eines Wertes von den vorausgehenden Werten ist hier in der Regel nicht gegeben (im Gegensatz zu anderen Verfahren)
  • Es gibt nicht die Voraussetzung, dass die Daten voneinander unabhängig sind, sondern die interne Abhängigkeit ist gerade Gegenstand der Analyse.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Welcher Analyse entspricht die ZRA?

A

Mathematisch gesehen entspricht die ZRA einer multipler Regression

  • Die Prädiktorvariablen sind ebenfalls Zeitreihen, weil aufeinanderfolgende Datenpunkte sind ähnlicher als sehr entfernte Datenpunkte
  • Wie lässt sich die Systematik der Werte im Zeitverlauf beschreiben und vorhersagen?
  • Die ZRA basiert sich auf einer multiplen Regressionsgleichung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist die serielle Abhängigkeit?

A

Bei einer ZRA werden die Datenpunkte meist chronologisch und über einen bestimmten Zeitraum aufgehoben. Diese Daten sind meist nicht völlig zufällig, sondern es gibt schon eine Abhängigkeit zwischen den Daten
- Die serielle Abhängigkeit ist die Abhängigkeit von aufeinanderfolgenden Datenpunkten (sie sind sich ähnlicher als entfernte Datenpunkte)
- Das System hat eine gewisse Trägheit und Gedächtnis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Die ZRA ähnelt die multiple Regression, mit dem Unterschied, dass beide Prädiktoren Zeitreihen haben. Was sind Prädiktoren, die auf der Zeit beruhen?

A

Prädiktoren, die auf der Zeit (t) beruhen, können z.B. linearer Trend sein
y = b0 + b1 * t
- Die Zeit kann ein Trend aufweisen, was tatsächlich der Zeitprädiktor ist
- Die Zeit kann als Prädiktor benutzt werden und Varianzanteil aufklären (wie sich die Daten über die Zeit entwickeln - Trend?)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Die ZRA ähnelt die multiple Regression, mit dem Unterschied, dass beide Prädiktoren Zeitreihen haben. Was sind Prädiktoren, die sich aus der Zeitreihe selbst ergeben?

A

Es gibt zwei Varianten:

1) Autoregressive Effekte: Vorherige Werte der Zeitreihe beeinflussen den aktuellen Wert
- Je nachdem, wie viele Werte einen direkten Einfluss auf einen Wert haben, spricht man von der Ordnung des Autoregressiven Effektes (2 vorherigen Zeitpunkte beeinflussen einen Punkt –> autoregressiver Effekt 2. Ordnung AR-2)

2) Moving Average: Vorherige “Fehler” beeinflussen den aktuellen Wert
- Je nachdem, wie viele vorherige Fehler einen direkten Einfluss haben, spricht man von der Ordnung des Moving Average Effekts (2 vorhergehende Fehler beeinflussen einen Wert –> Moving Average Effekt 2. Ordnung MA-2)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist die Autoregression?

A

“Autoregression” meint, dass man die zeitverschobene Zeitreihe (Lag-Zeitreihe) als Prädiktor verwendet
- Jeder Wert soll aus dem vorhergehenden Wert derselben Variable vorhergesagt werden
- Der aktuelle Wert einer Variable auf Grundlage des vorherigen Wertes derselben Variable vorhergesagt wird

Beispiele:
- Kann man die Stimmung an einem Tag durch die Stimmung am Vortag vorhersagen?
- Lässt sich das Wetter aus dem Wetter am Vortag vorhersagen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was für Werte können bei der Autoregression benutzt werden? Wie weit nach hinten?

A

Für die Vorhersage wird also der unmittelbar vorhergehende Wert verwendet:
- Zusammenhang zwischen Zeitreihe und lag-1-Zeitreihe: Autoregression erster Ordnung

Dabei kann für die Vorhersage nicht nur der unmittelbar vorhergehende Wert verwendet werden (lag-1-Reihe), sondern darüber hinaus auch noch weiter zurückliegende Werte
- Lag-2-Reihe: ursprüngliche Zeitreihe wird um 2 Werte verschoben: Autoregression 2. Ordnung etc

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist der “LAG”?

A

Ein lag (Verschiebung) gibt an, um wie viele Zeitabschnitte einer Zeitreihe verschoben wurde

Definition “lag-k-Reihe”: Eine lag-k-Reihe ist eine um k Zeitabschnitte “nach rechts” verschobene Zeitreihe
z.B. Korrelation der Zeitreihe mit der lag-1-Zeitreihe: Autokorrelation erster Ordnung

17
Q

Was sind die zwei Typen von Autoregressivem Einfluss?

A

1) Indirekt: Der Einfluss eines früheren Zeitpunktes (z.B. t-2 –> zwei Tage vorher) kommt nur dadurch zustande, dass dieser mit t-1 zusammenhängt und t-1 wiederum mit t
z.B. t-3 beeinflusst t-2, t-2 beeinflusst t-1 und t-1 beeinflusst t

2) Direkt: Über den Einfluss von t-1 hinaus hat t-2 auch noch einen eigenständigen Einfluss auf t
z.B. t-3 beeinflusst t direkt

18
Q

Was ist der Zufallsschock?

A

Zufallsschock = Zufallskomponente, die die Ausprägung der Zufallsvariablen beeinflusst
- Das ist das, was zu jedem Zeitpunkt neu wirkt –> ist komplett zufällig
- Entspricht dem “Fehler” in herkömmlichen Regressionsmodellen “at”
- White noise: besteht nur aus Zufallsschocks, die nur zum jeweiligen Zeitpunkt wirken

19
Q

Wie wird der Zufallsschock berechnet?

A

Die Ausprägung der Zufallsvariablen (yt bzw zt) setzt sich zusammen aus dem aktuellen Zufallsschock und ggf. dem Einfluss früherer Zustände (AR) oder früherer Zufallsschocks (MA), ggf. einem Trend und ggf. Einflüssen anderer Variablen.

20
Q

Was ist der Moving Average (MA-Prozess)?

A

Im Gegensatz zu einem Autoregressiven Effekt besteht hier der direkte Einfluss nicht zwischen dem vorherigen Wert und dem aktuellen Wert, sondern zwischen dem vorherigen Fehler (at-1) und dem aktuellen Wert

  • Schwarze Pfeile: keine serielle Abhängigkeit: kein AR- und kein MA-Prozess
  • Schwarze und rote Pfeile: Moving Average Prozess erster Ordnung: MA-1
  • Schwarze, rote und grüne Pfeile: Moving Average Prozess zweiter Ordnung: MA-2
21
Q

Können AR und MA gleichzeitig auftreten?

A

Ja, AR-MA

22
Q

Was ist der dritte Prädiktor der ZRA?

A

Eine andere Zeitreihe kann als Prädiktor dienen (z.B. eine andere Intervention (kodiert mit 0,1) oder eine andere Variable)
- Dabei können auch zeitversetzte Werte einer anderen Variablen als Prädiktoren in Frage kommen
Xt-1

23
Q

Mit welchem Prädiktor kann man periodische Schwankungen beurteilen?

A

Anhand der Autokorrelation
- In vielen Fällen wird die Autokorrelationsfunktion (ACF) verwendet, um periodische Schwankungen zu beurteilen. Die ACF zeigt die Korrelation zwischen den Werten der Zeitreihe und ihren verschobenen Versionen (Lags) bei verschiedenen Zeitabständen. Signifikante Spitzen in der ACF bei bestimmten Lags können darauf hinweisen, dass periodische Muster vorhanden sind.

24
Q

Was sind die 4 Voraussetzungen für die Anwendung der Zeitreihenanalyse?

A
  • Ausreichende Anzahl an Datenpunkten (mehr als 20 z.B.)
  • Äquidistante Zeitmessung
  • Intervallskalierte abhängige Variable: Die Daten, sollen auf einer Intervallskala eingeordnet sein (z.B. 1,2,3 und nicht 1,02,1,72, 2,91 usw.)
  • Stationarität: kann im Verlauf der Datenanalyse hergestellt werden (Die Zeitreihe verändert sich über die Zeit nicht bedeutsam, z.B. Mittelwert, Varianz, Autoregression)
25
Q

Was ist die Voraussetzung der Stationarität?

A

Der erste Schritt in ZRA
- Die Datenpunkten sollen stationär sein, ansonsten werden die Ergebnisse irreführend sein

Warum ist das wichtig:
- Stabilität der statistischen Eigenschaften: Mittelwert, Varianz und Autokorrelation bleiben konstant. Bessere/zuverlässige Vorhersage

  • Modelbildung und Vorhersage sind besser
  • Statistische Vorhersage ist aussagekräftiger
  • Vorhersagegenauigkeit steigt
  • Kausalitätsannahme
26
Q

Was ist die Mittelwertsstationarität?

A
  • Der durchschnittliche Wert in der Zeitreihe bleibt der gleiche unabhängig von der Zeit
    Mittelwertsstationarität liegt vor, wenn der Erwartungswert unabhängig vom Zeitpunkt ist (nicht gegeben, wenn die Zeitreihe einen Trend beinhaltet). Das bedeutet aber, dass die Zeitreihe keinen Trend enthält oder keine andere Periodik
  • Beispiel: Wir messen die Temperatur in einer Stadt über das Jahr. Wenn wir eine Mittelwertstationatität beobachten, heißt das, dass unabhängig davon, welchen Tag über das Jahr wir schauen, die Temperatur wird ungefähr die gleiche sein. D.h. es gibt keinen Trend von Steigung und Senkung
27
Q

Was ist die Varianzstationarität?

A

Varianzstationarität liegt vor, wenn die Varianz über die Zeit etwa gleich bleibt, d.h. der Erwartungswert der Varianz ist unabhängig vom Zeitpunkt

28
Q

Was ist White noise in ZRA?

A

White-Noise-Prozeß = Zufallsprozess der reinsten Form: Der Wert zu jedem Zeitpunkt ist unabhängig von den Werten anderer Zeitpunkte oder anderer Variablen

  • Zu jedem Zeitpunkt ist die Ausprägung der Variablen nur vom Zufall anhängig
  • Für jeden Zeitabschnitt ist die Verteilung der Zufallsvariablen gleich; ebenso die Erwartungswerte und die Varianz
29
Q

Wofür wird White noise in ZRA benutzt?

A
  • White noise dient als Modell, mit dem eine systematische
    Zeitreihe verglichen wird
  • Z. B. Bleibt tatsächlich white noise übrig, wenn bestimmte Systematiken entfernt wurden
  • Stochastischer Prozess
30
Q

Was ist Prewhitening (“Vorwäsche”)

A

Serielle Abhängigkeit wird aus einer Zeitreihe entfernt, indem Trends, AR-Prozesse, MA-Prozesse eliminiert werden –> Die Residuen dieser Regression sind dann frei von serieller Abhängigkeit und können dann auch mit anderen statistischen Verfahren bearbeitet werden (Voraussetzung der „Unabhängigkeit von Fehlern“ ist dann gegeben)

  • Die Bereinigung der serielle Abhängigkeit, bzw. AR- und MA-Prozesse –> nur die Residuen bleiben, die dann mit normalen statistischen Verfahren analysiert werden können
31
Q

Was sind Stochastische Prozesse bei ZRA?

A

Ein stochastischer Prozess ist eine zeitliche Abfolge von Zufallsvariablen die zufällig sind und liefert das theoretische Modell für die empirische Zeitreihe

  • In der Zeitreihenanalyse wird von der empirischen Zeitreihe auf den zugrunde liegenden stochastischen Prozess geschlossen (Zufallsprozesse)
  • Die Zeitreihenanalyse versucht herauszufinden, welcher stochastische Prozess die vorliegende Zeitreihe erzeugen kann
  • Ziel: Modell des stochastischen Prozesses finden
32
Q

Was sind die ARIMA-Modelle?

A

Eine bestimmte, weit verbreitete Analysestrategie für Zeitreihendaten
- Erlaubt die Vorhersage von zukünftigen Werten auf der Basis von vorherigen Daten

AR - Autoregressive: Messung der Beziehung zwischen aktuellem und vorherigen Werten der selben Variable
I - Integration (Trend): Messung der nicht-stationäre Daten, die Veränderung über die Zeit
MA - Moving Average: Messung der Beziehung zwischen aktuellem Wert und den vorherigen Fehlern

33
Q

Was ist das Ziel der ZRA?

A

Die Daten in ihren Bestandteile zu zerlegen und ein Modell zu finden
- Dabei unterscheiden wir zwischen internen Struktur der Daten (z.B. Trend, Autoregression) und dem Zusammenhang mit einer anderen Variable