Zeitreihenanalyse 1 Flashcards
Was ist die Zeitreihenanalyse?
Eine Analyse, mit der wir Daten analysieren und Trends aufdecken können. Die Daten sollen stündig, täglich, wöchentlich, monatlich oder jährlich gesammelt werden (äquidistant - sollen gleiche Abstände haben)
- Keine kontinuierliche Sammlung von Daten, sondern auf bestimmte Zeitpunkte
- Zeitliche Verläufe eines bestimmten Merkmals
- Zeitreihenanalyse benötigt viele Datenpunkte, mindestens 20-50
- Daten können sich auf Personen oder andere Merkmalsträger beziehen
Beispiel: Monatliche Arbeitslosenzahlen in Deutschland seit 2010
Können bei ZRA pro Zeiteinheit mehr als eine Variable betrachtet werden?
Ja, man kann entweder nur eine Variable (univariate ZRA) pro Zeiteinheit messen oder mehrere (bivariate/multivariate ZRA)
Was sind die zwei Fragen, auf die die ZRA eine Antwort geben kann?
1) Hat die Intervention zu einer Veränderung geführt, wenn ja, wie groß/stark ist diese?
- Differenz vorher-nachher
- Statistische Signifikanz
- Effektgrößen
2) Ist die Veränderung auf die Intervention zurückzuführen?
- Frage nach der internen Validität
- Wird nicht mit der Auswertung der Daten festgestellt, sondern muss man ein passendes/gutes Design auswählen
Wie werden die Baseline- und Interventionswerten bei ZRA dargestellt?
Baseline = 0
Intervention = 1
Was sind die Ziele der ZRA?
- Erkennen der Systematik einer Zeitreihe, um dann eine Intervention abzuleiten
- Beurteilung einer Interventionswirkung: Ändert sich das Verhalten nach Einsetzung der Intervention?
- Zusammenfassung der Information bezüglich periodischer Schwankungen zu wenigen Kennwerten, die weiter verrechnet werden
- Identifikation der internen Struktur der Zeitreihe, um diese zu eliminieren, damit später andere statistische Verfahren angewendet werden können
- Analyse der gegenseitigen Beeinflussung zweier Zeitreihen, um Hypothesen über kausale Ursache-Wirkungs-Richtungen zu prüfen –> Multivariate ZRA
Was ist der Einsatzgebiet der univariaten Zeitreihenanalyse?
- Entwicklung eines Vorhersagemodells zur Untersuchung der natürlichen inra-individuellen Variabilität und Stabilität von Verhalten im zeitlichen Verlauf (Vorhersage, Daten, Trends, Muster oder zyklisches Verhalten)
- Keine Manipulation, nur Beobachtung
- Hier gibt es keine Intervention –> nicht-experimentell
- Wir können messen, ob eine serielle Abhängigkeit vorhanden ist (dann können wir sie eliminieren, um andere Verfahren einsetzen zu können)
Was ist der Einsatzgebiet der bivariaten Zeitreihenanalyse (Interventionsanalyse)?
- Entwicklung eines Interventionsmodells zur Untersuchung der Auswirkungen einer Intervention auf das Verhalten. Untersuchung von zwei Variablen und wie sie im Laufe der Zeit sich verändern (Korrelation, Kausalschlüsse)
- Wie bewirkt eine Intervention auf das Verhalten der Person
- Benutzt in klinischer Psychologie und anwendungspsychologie
Was ist der Einsatzgebiet der multivariaten Zeitreihenanalyse?
- Analyse dynamischer Interaktionen im Zeitverlauf zur Überprüfung kausaler Hypothesen über die Wirkungsrichtung der Beeinflussung (zeitliche Richtung der Beeinflussung von mehreren Variablen)
- Untersuchung von Zusammenhängen und Kausalität zwischen Variablen
- Hier haben wir mehrere ZRA gleichzeitig
Was ist der Unterschied zwischen ZRA und anderen statistischen Verfahren?
- Abfolge der Variablen: Bei den anderen statistischen Verfahren ist die Reihenfolge der einzelnen Werte unwichtig. Bei ZRA ist aber das genau sehr wichtig
- Die Voraussetzung bei normalen Verfahren ist, dass die Daten voneinander unabhängig sind und der Wert einer Vp keinen Einfluss auf den Wert der nächsten hat –> Bei ZRA aber nicht
- Abhängigkeit der Werte: Die Unabhängigkeit eines Wertes von den vorausgehenden Werten ist hier in der Regel nicht gegeben (im Gegensatz zu anderen Verfahren)
- Es gibt nicht die Voraussetzung, dass die Daten voneinander unabhängig sind, sondern die interne Abhängigkeit ist gerade Gegenstand der Analyse.
Welcher Analyse entspricht die ZRA?
Mathematisch gesehen entspricht die ZRA einer multipler Regression
- Die Prädiktorvariablen sind ebenfalls Zeitreihen, weil aufeinanderfolgende Datenpunkte sind ähnlicher als sehr entfernte Datenpunkte
- Wie lässt sich die Systematik der Werte im Zeitverlauf beschreiben und vorhersagen?
- Die ZRA basiert sich auf einer multiplen Regressionsgleichung
Was ist die serielle Abhängigkeit?
Bei einer ZRA werden die Datenpunkte meist chronologisch und über einen bestimmten Zeitraum aufgehoben. Diese Daten sind meist nicht völlig zufällig, sondern es gibt schon eine Abhängigkeit zwischen den Daten
- Die serielle Abhängigkeit ist die Abhängigkeit von aufeinanderfolgenden Datenpunkten (sie sind sich ähnlicher als entfernte Datenpunkte)
- Das System hat eine gewisse Trägheit und Gedächtnis
Die ZRA ähnelt die multiple Regression, mit dem Unterschied, dass beide Prädiktoren Zeitreihen haben. Was sind Prädiktoren, die auf der Zeit beruhen?
Prädiktoren, die auf der Zeit (t) beruhen, können z.B. linearer Trend sein
y = b0 + b1 * t
- Die Zeit kann ein Trend aufweisen, was tatsächlich der Zeitprädiktor ist
- Die Zeit kann als Prädiktor benutzt werden und Varianzanteil aufklären (wie sich die Daten über die Zeit entwickeln - Trend?)
Die ZRA ähnelt die multiple Regression, mit dem Unterschied, dass beide Prädiktoren Zeitreihen haben. Was sind Prädiktoren, die sich aus der Zeitreihe selbst ergeben?
Es gibt zwei Varianten:
1) Autoregressive Effekte: Vorherige Werte der Zeitreihe beeinflussen den aktuellen Wert
- Je nachdem, wie viele Werte einen direkten Einfluss auf einen Wert haben, spricht man von der Ordnung des Autoregressiven Effektes (2 vorherigen Zeitpunkte beeinflussen einen Punkt –> autoregressiver Effekt 2. Ordnung AR-2)
2) Moving Average: Vorherige “Fehler” beeinflussen den aktuellen Wert
- Je nachdem, wie viele vorherige Fehler einen direkten Einfluss haben, spricht man von der Ordnung des Moving Average Effekts (2 vorhergehende Fehler beeinflussen einen Wert –> Moving Average Effekt 2. Ordnung MA-2)
Was ist die Autoregression?
“Autoregression” meint, dass man die zeitverschobene Zeitreihe (Lag-Zeitreihe) als Prädiktor verwendet
- Jeder Wert soll aus dem vorhergehenden Wert derselben Variable vorhergesagt werden
- Der aktuelle Wert einer Variable auf Grundlage des vorherigen Wertes derselben Variable vorhergesagt wird
Beispiele:
- Kann man die Stimmung an einem Tag durch die Stimmung am Vortag vorhersagen?
- Lässt sich das Wetter aus dem Wetter am Vortag vorhersagen
Was für Werte können bei der Autoregression benutzt werden? Wie weit nach hinten?
Für die Vorhersage wird also der unmittelbar vorhergehende Wert verwendet:
- Zusammenhang zwischen Zeitreihe und lag-1-Zeitreihe: Autoregression erster Ordnung
Dabei kann für die Vorhersage nicht nur der unmittelbar vorhergehende Wert verwendet werden (lag-1-Reihe), sondern darüber hinaus auch noch weiter zurückliegende Werte
- Lag-2-Reihe: ursprüngliche Zeitreihe wird um 2 Werte verschoben: Autoregression 2. Ordnung etc