7. Zeitreihenanalyse Flashcards
Was ist die Zeitreihenanalyse?
Analyse einer Vielzahl von Messzeitpunkten
mind.50-100
Zeitreihenanalse: was sind die Ziele?
— Ermittlung von zyklischen Phänomenen
z.B saisonale Effekte
— Vorhersage von zukünftigen Ereignissen/Verläufen
z.B. Vorhersage von Therapieverläufen
Erfasse was mit dem Begriff „Autokorrelationen“ gemeint ist.
Korrelationen zwischen Messzeitpunkten mit Abstand „k“ (lag)
Abstand „k“?
lag
Erfasse saisonale Abhängigkeit.
Nenne ein Beispiel.
ein Muster, welches alle „k“ Elemente auftritt
z.B. Verlauf der Anzahl der Flugreisen im Laufe der Jahre
Nenne ein Beispiel für Zeitreihenanalysen
ARIMA-Modell
Arima-Modell — wofür steht ARIMA?
AutoRegressive Integrated Moving Average model
ARIMA-Modell — Funktion?
Beschreibung der Systematik einer Zeitreihe, anhand 3 Parametern
Was sind die drei Parametern des ARIMA-Modells?
p
d
q
ARIMA-Modell: Parameter
Wofür steht „p“?
Anzahl der autoregressiven Anteile der Zeitreihe
ARIMA-Modell: Parameter
Wofür steht „d“?
Anzahl der notwendigen Differenzierungen um eine Zeitreihe stationär zu machen
ARIMA-Modell: Parameter
Wofür steht „q“?
Anzahl der moving-Average-Komponenten der Zeitreihe
Wann wird ein Merkmal als STATIONÄR bezeichnet?
falls die Verteilungsmerkmale
(Mittelwert, Varianz, Schiefe, Exzess)
von Stichproben aus der Zeitreihe nicht vom absoluten Zeitpunkt ihrer Ziehung abhängen
Wann liegt ein Trend vor?
wenn der Mittelwert von Stichproben aus der Zeitreihe sich systematisch ändert
Warum ist eine Zeitreihe häufig NICHT STATIONÄR?
wegen einem Trends
Was muss mit einer nicht stationären Zeitreihe gemacht werden?
Differenzierung
Differenzierung: was ist der Ziel?
Stationarität zu erreichen
Erklaere den Prozess der Differenzierung
- paarweise Differenzbildung resultiert in eine neue Zeitreihe
- z.b. 2,4,6,8,10 –> 2,2,2,2
- muss gelegnetlich mehrmals wiederholt werden bis sich eine stationaere Zeitreihe ergibt
z.b. 1, 4, 9, 16, 25 –> 3, 5, 7, 9 –> 2, 2, 2
d = 2
ARIMA (0, 2, 0)
Differenzierung: meist ist jedoch eine vollstaendige “Verflachung” der Zeitreihe…
- nicht moeglich
- nicht sinnvoll, da saisonale Effekte ermittelt werden sollen
Differenzierung: warum ist eine vollstaendige “Verflachung” der Zeitreihe nicht inhaltlich sinnvoll?
da saisonale Effekte ermittelt werden sollen
Erfasse was mit “streng stationaer” gemeint ist.
- wenn die Verteilungskennwerte in allen moeglichen Teilstichproben identisch sind
- —> d.h. Kennwerte sind unabhaengig von der Zeit
Erfasse was mit “schwach” stationaer gemeint ist.
- Mittelwert und Kovarianzen innerhalb der SP sollten unabhaengig von der Zeit sein
Stationaritaet “zweiter Ordnung”
Wenn Mittelwert und Kovarianzen innerhalb der SP unabhaengig von der Zeit sind
Was wird mit “integrated” gemeint?
stationaer nach differenzbildung
Wann kann Parameter P eingesetzt werden?
- nach Parameter d
- wenn festgestellt ist dass die Zeitreihe stationaer ist
Was untersucht Parameter P?
die Autokorrelationsstruktur der Zeitreihe
Parameter P: Vorteile bzgl. Lags
je mehr lags, desto praeziser
Parameter P: Nachteile bzgl. Lags
sehr viele Lags:
- komplexe Gleichungen zur Vorhersage des naechsten - Messzeitpunktes
komplexe Modelle
Was bestimmt Parameter q?
Wie viele vorgehende zufaellige Fehler in der Modellierung beruecksichtigt werden.
Erfasse was bei “error propagation” gemeint ist.
Die von dem AR-Modell vorhergesagten Messwerte koennen von vorgehenden Messfehlern abhaengen.
Erfasse die Zussamenhaenge des AR-Modells.
- Zusammenhang zwischen Messwerte
- KEIN Zusammenhang zwischen den Messfehlern
Erfasse was mit “random shock” gemeint ist.
ein zufaelliger FEHLER beeinflusst die Beobachtung
Nenne die moeglichen Veraenderungen in einer Zeitreihe.
1) Aenderung im TREND
2) Aenderung im NIVEAU
3) Kompensatorische VARIABILITAETSAENDERUNG
Was fuehrt zu moegliche Effekte in einer Zeitreihe?
eine Intervention
1) Aenderung im TREND:
- was heisst das?
- was fuer Arten gibt es?
- Aenderung in der Steigung
- abrupt / verzoegert
2) Aenderung im NIVEAU
- was heisst das?
- was fuer Arten gibt es?
- Aenderung in der Mittleren Anzahl
- Abrupt / verzoegert
3) Kompensatorische Variablitaet
die Intervention loest eine Aenderung der Variabilitaet aus
Ein Synonym fuer Intervention
Treatment
Entfernung eines Treatments
Unterschied sollte nach der Entfernung des Treatment wieder zurueck gehen
VORAUSSETZUNG: temporaere Treatment-wirkung
Verzoegertes Treatment
- kaum Alternativerklaerungen moeglich
- Externe Validitaet erhoeht - da Effekt in 2 Populationen zu 2 Zeitpunkten
Unterbrochener Zeitreihen: Probleme
1) langsame und graduelle Implementierung –> Diffusion
2) unbekanntes Intervall zwischen Ursache und Effekt
3) zu urze Zeitreihen
4) Beschraenkung von Archivdaten
Probleme bei unterborchener Zeitreihen: Archivdaten
- Datenqualitaet schwer zu bewerten
- schlechte Qualitaet
- Verfaelschungsgefahr –> durch Veraenderung des Konstrukts ueber die Zeit
Probleme bei unterborchener Zeitreihen: Diffusion
- schrittweise Interventionen
z. B. Schulungsprogramme (klinisches Personal kann nicht zu identischem Zeitpunkt komplett geschult werden)
Probleme bei unterborchener Zeitreihen: Unbekanntes Interval
- zeitlicher Verzoegerung z.B. Lungenkrebs beim Rauchen
- Verwaesserung des Effekts
Probleme bei unterborchener Zeitreihen: zu Kurz
- mind. 100N
- 50 vor X, 50 nach X
- je groesser der lag, desto relevanter ist die Anzahl der Messzeitpunkte