0 Daumen
247 Aufrufe

Ich versuche gerade ein ARIMAX-Modell zur Prognose von Zeitreihendaten in Matlab zu programmieren. Bei einem ARIMAX-Modell handelt sich also um ein ARIMA Modell mit exogenen Inputgrößen, welche wichtige zusätzliche Informationen zur Prognose bieten.

Zunächst wird das Modell entwickelt, d.h. die verschiedenen Koeffizienten werden ermittelt, und in einem zweiten Schritt erfolgt dann die Prognose. In beiden Schritten stehen die exogenen Inputgrößen zur Verfügung.

Bei der Entwicklung des Modells, also bei der Berechnung der Koeffizienten, habe ich folgendes Problem:

Ich habe die Zeitreihendaten im Vektor Y, welche sich aus ihren eigenen Lags ergeben. Außerdem habe ich die exogenen Daten im Vektor X. Beide meiner Vektoren sind gleich lang. Sie umfassen beide genau ein Jahr. Allerdings bekomme ich nun die Fehlermeldung, dass der Vektor X länger sein müsste, damit er in der Regression verwendet werden kann.

Ich hab nun die Möglichkeit X nach hinten raus zu verlängern, sodass ich zusätzliche sehr aktuelle Werte berücksichtige. Oder ich habe die Möglichkeit X nach vorne raus zu verlängern, sodass die zusätzlich berücksichtigten Werte sehr über ein Jahr alt sind.

Welches ist der richtige Weg?

Avatar von

1 Antwort

0 Daumen

Antwort mit KI erzeugt

Länge des Regressionsvektors bei Entwicklung eines ARIMAX Modells

Bei der Entwicklung eines ARIMAX-Modells stellt sich die Frage, wie man mit der Länge des Vektors für die exogenen Variablen (X) umgeht, insbesondere wenn eine Fehlermeldung darauf hinweist, dass X länger sein muss, um in der Regression verwendet werden zu können. Zu beachten ist, dass bei der Einbeziehung von Lags der Zielvariablen (Y) sowie der Lags von X in das Modell, die effektive Größe des Datensatzes für das Training des Modells kleiner wird, da für die Berechnung der ersten Werte einige Datenpunkte als "verloren" gelten – sie werden verwendet, um die Lags zu bilden, aber sie können nicht selbst in der Regression genutzt werden, da keine vorherigen Werte für sie vorhanden sind.

Das Hauptproblem bei der Verlängerung von X ohne Anpassung von Y oder ohne eine gleichzeitige Anpassung der Modellstruktur ist, dass die Zeitreihenanalyse auf der Annahme basiert, dass jede Beobachtung in Y durch ein Set von vorherigen Werten von Y selbst und möglicherweise durch Werte der exogenen Variablen X erklärt werden kann. Wenn also X verlängert wird, ohne die Modellstruktur anzupassen, kann dies zu Inkonsistenzen und falschen Schätzungen führen.

Welcher Weg ist richtig?

1. X nach hinten verlängern (Berücksichtigung sehr aktueller Werte): Dieser Ansatz kann sinnvoll sein, wenn die Verzögerung zwischen dem Einfluss von X auf Y kurz ist. Durch Hinzufügen aktuellerer Werte von X können Sie möglicherweise eine genauere und aktuellere Schätzung der Koeffizienten für die Beziehung zwischen X und Y erhalten. Jedoch müssen Sie auch Ihr Modell so anpassen, dass es diese zusätzlichen Datenpunkte korrekt nutzt, was bedeutet, dass die Lags von Y entsprechend angepasst oder verlängert werden müssen, um mit den zusätzlichen Datenpunkten von X zu korrespondieren.

2. X nach vorne verlängern (Berücksichtigung älterer Werte): Dies könnte hilfreich sein, wenn die historischen Daten von X wichtige Informationen für die Vorhersage von Y enthalten, die in den neueren Daten nicht vorhanden sind. Dieser Ansatz erhöht die Menge der historischen Daten, die bei der Modellberechnung berücksichtigt werden, könnte aber das Modell dazu bringen, seine Prognosen stärker auf vergangene Muster zu stützen, was nicht immer wünschenswert ist, besonders wenn sich die Dynamik der Zeitreihe geändert hat.

Empfehlung:

Die Entscheidung, ob man X nach vorne oder hinten verlängern sollte, hängt stark von der spezifischen Anwendung und der Natur der Daten ab. Generell ist es wichtig, eine Methodik zu wählen, die die logische Struktur der Beziehung zwischen X und Y berücksichtigt. Eine ausführliche explorative Datenanalyse kann hierbei aufzeigen, wie stark vergangene Werte die Zielvariable beeinflussen und ob neuere oder ältere Daten von X relevanter für das Modell sind. Oftmals ist eine Kombination aus Modellanpassungen und sorgfältiger Auswahl der hinzugefügten Datenpunkte für X die beste Lösung.
Avatar von

Ein anderes Problem?

Stell deine Frage

Ähnliche Fragen

Willkommen bei der Nanolounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community