Moving Average Multiplikativ Modell
Spreadsheet-Implementierung saisonaler Anpassung und exponentieller Glättung. Es ist einfach, saisonale Anpassung durchzuführen und exponentielle Glättungsmodelle mit Excel zu platzieren. Die Bildschirmbilder und Diagramme unten sind aus einer Tabellenkalkulation entnommen, die eingerichtet wurde, um multiplikative saisonale Anpassung und lineare exponentielle Glättung auf der Nach vierteljährlichen Verkaufsdaten von Outboard Marine. Um eine Kopie der Tabellenkalkulation selbst zu erhalten, klicken Sie hier Die Version der linearen exponentiellen Glättung, die hier zum Zwecke der Demonstration verwendet wird, ist die Version Browns, nur weil sie mit einer einzigen Spalte implementiert werden kann Von Formeln und es gibt nur eine Glättung Konstante zu optimieren In der Regel ist es besser, Holt-Version verwenden, die separate Glättung Konstanten für Ebene und Trend hat. Der Prognoseprozess läuft wie folgt i zuerst die Daten saisonbereinigt ii dann Prognosen für die generiert werden Saisonbereinigte Daten über lineare exponentielle Glättung und iii schließlich werden die saisonbereinigten Prognosen wiederhergestellt, um Prognosen für die ursprüngliche Serie zu erhalten. Der saisonale Anpassungsprozess wird in den Spalten D bis G durchgeführt. Der erste Schritt in der saisonalen Anpassung besteht darin, einen zentrierten gleitenden Durchschnitt zu berechnen Hier in Spalte D Dies kann getan werden, indem man den Durchschnitt von zwei einjährigen Durchschnitten nimmt, die um eine Periode relativ zueinander versetzt sind. Eine Kombination von zwei Offset-Mittelwerten anstatt einem einzigen Mittelwert wird für Zentrierungszwecke benötigt, wenn die Anzahl von Jahreszeiten ist sogar Der nächste Schritt ist, das Verhältnis zu gleitenden Durchschnitt zu berechnen - die ursprünglichen Daten geteilt durch den gleitenden Durchschnitt in jeder Periode - die hier in Spalte E durchgeführt wird Dies wird auch als Trend-Zyklus-Komponente des Musters, Insofern, als Trend - und Konjunktureffekte als alles verbleiben könnten, was nach einer durchschnittlichen Wertung über ein ganzjähriges Jahr übrig bleibt. Natürlich konnten auch Monate-zu-Monat-Änderungen, die nicht auf Saisonalität zurückzuführen sind, durch viele andere Faktoren bestimmt werden Der 12-Monats-Durchschnitt glättet über sie zu einem großen Teil Der geschätzte saisonale Index für jede Jahreszeit wird berechnet, indem zuerst alle Verhältnisse für die jeweilige Jahreszeit gemittelt werden, die in den Zellen G3-G6 mit einer AVERAGEIF-Formel durchgeführt wird. Die durchschnittlichen Verhältnisse werden dann neu skaliert So dass sie auf genau das 100-fache der Anzahl der Perioden in einer Jahreszeit oder 400 in diesem Fall, die in den Zellen H3-H6 getan wird. In der Spalte F werden die VLOOKUP-Formeln verwendet, um den entsprechenden saisonalen Indexwert in jede Zeile einzufügen Die Datentabelle, nach dem Quartal des Jahres stellt es Der zentrierte gleitenden Durchschnitt und die saisonbereinigten Daten am Ende aussehen wie this. Hinweis, dass der gleitende Durchschnitt sieht in der Regel wie eine glattere Version der saisonbereinigten Serien, und es ist kürzer auf Beide endet. Ein anderes Arbeitsblatt in der gleichen Excel-Datei zeigt die Anwendung des linearen exponentiellen Glättungsmodells auf die saisonbereinigten Daten, beginnend im Spalten-GA-Wert für die Glättungskonstante alpha wird über der Prognosespalte hier in der Zelle H9 und zur Bequemlichkeit eingegeben Wird der Bereichsname Alpha zugewiesen Der Name wird mit dem Befehl "Name erstellen" zugewiesen Das LES-Modell wird initialisiert, indem die ersten beiden Prognosen gleich dem ersten Istwert der saisonbereinigten Serie gesetzt werden. Die hier verwendete Formel für die LES-Prognose ist die Single - Gleichung rekursive Form von Brown s model. This Formel wird in die Zelle entsprechend der dritten Periode hier eingegeben, Zelle H15 und kopiert von dort Hinweis, dass die LES-Prognose für die aktuelle Periode bezieht sich auf die beiden vorhergehenden Beobachtungen und die beiden vorangegangenen Prognosefehler , Sowie auf den Wert von alpha So bezieht sich die Prognoseformel in Zeile 15 nur auf Daten, die in Zeile 14 und früher verfügbar waren. Natürlich, wenn wir einfach anstelle einer linearen exponentiellen Glättung verwenden wollten, könnten wir die SES-Formel ersetzen Hier stattdessen könnten wir auch Holts anstelle von Browns LES-Modell verwenden, das zwei weitere Spalten von Formeln benötigt, um das Level und den Trend zu berechnen, die in der Prognose verwendet werden. Die Fehler werden in der nächsten Spalte hier berechnet, Spalte J durch Subtrahieren Die Prognosen aus den Istwerten Der Wurzel-Mittelquadratfehler wird als Quadratwurzel der Varianz der Fehler plus dem Quadrat des Mittels berechnet. Dies folgt aus der mathematischen Identität MSE VARIANCE Fehler AVERAGE Fehler 2 Bei der Berechnung des Mittelwertes und der Varianz der Fehler In dieser Formel werden die ersten beiden Perioden ausgeschlossen, weil das Modell eigentlich nicht mit der Prognose beginnt, bis die dritte Periode Zeile 15 auf der Kalkulationstabelle ist. Der optimale Wert von alpha kann entweder durch manuelles Ändern von Alpha gefunden werden, bis das minimale RMSE gefunden wird oder sonst Kann den Solver verwenden, um eine genaue Minimierung durchzuführen Der Wert von alpha, den der Solver gefunden hat, ist hier alpha 0 471.Es ist in der Regel eine gute Idee, die Fehler des Modells in transformierten Einheiten zu zeichnen und auch zu berechnen und plotten ihre Autokorrelationen an Lags Von bis zu einer Jahreszeit Hier ist ein Zeitreihenplot der saisonbereinigten Fehler. Die Fehlerautokorrelationen werden mit der CORREL-Funktion berechnet, um die Korrelationen der Fehler mit sich selbst zu berechnen, die von einer oder mehreren Perioden verzögert sind - Details werden in der Kalkulationstabelle angezeigt Modell Hier ist eine Handlung der Autokorrelationen der Fehler bei den ersten fünf Verzögerungen. Die Autokorrelationen bei den Verzögerungen 1 bis 3 sind sehr nahe bei Null, aber die Spitze bei Verzögerung 4, deren Wert 0 35 ist, ist etwas lästig - es deutet darauf hin, dass die Der saisonale Anpassungsprozess war nicht vollständig erfolgreich. Allerdings sind es eigentlich nur marginal signifikante 95 Signifikanzbänder zum Testen, ob Autokorrelationen signifikant von Null verschieden sind, etwa plus-oder-minus 2 SQRT nk, wobei n die Stichprobengröße und k die Verzögerung ist Hierbei ist n 38 und k von 1 bis 5, so dass die Quadratwurzel-von-n-minus-k für alle von ihnen etwa 6 ist und daher die Grenzen für die Prüfung der statistischen Signifikanz von Abweichungen von Null ungefähr plus - Oder-minus 2 6 oder 0 33 Wenn Sie den Wert von alpha per Hand in diesem Excel-Modell variieren, können Sie den Effekt auf die Zeitreihen und Autokorrelationsdiagramme der Fehler sowie auf den root-mean-squared-Fehler beobachten , Die unten dargestellt werden. Am unteren Rand der Tabellenkalkulation wird die Prognoseformel in die Zukunft hineingeladen, indem sie lediglich Prognosen für Istwerte an der Stelle, an der die Istdaten ablaufen, aussetzt - also wo die Zukunft beginnt Jede Zelle, in der ein zukünftiger Datenwert stattfinden würde, wird eine Zellenreferenz eingefügt, die auf die Prognose hinweist, die für diesen Zeitraum gemacht wurde. Alle anderen Formeln werden einfach von oben kopiert. Nichts, dass die Fehler für Prognosen der Zukunft alle als Null berechnet werden Das bedeutet nicht, dass die tatsächlichen Fehler null sein werden, sondern vielmehr nur die Tatsache, dass für die Zwecke der Vorhersage wir davon ausgehen, dass die zukünftigen Daten die Prognosen im Durchschnitt entsprechen werden. Die daraus resultierenden LES-Prognosen für die saisonbereinigten Daten sehen so aus Dieser besondere Wert von alpha, der für eine Periodenvorhersage optimal ist, ist der projizierte Trend leicht nach oben, was den lokalen Trend widerspiegelt, der in den letzten 2 Jahren beobachtet wurde. Für andere Werte von Alpha könnte eine ganz andere Trendprojektion sein Erhalten Es ist in der Regel eine gute Idee zu sehen, was mit der langfristigen Trendprojektion passiert, wenn Alpha abwechslungsreich ist, denn der Wert, der am besten für kurzfristige Prognosen ist, ist nicht unbedingt der beste Wert für die Vorhersage der weiter entfernten Zukunft , Hier ist das Ergebnis, das erhalten wird, wenn der Wert von alpha manuell auf 0 25 gesetzt wird. Der projizierte langfristige Trend ist nun eher negativ als positiv Mit einem kleineren Wert von alpha, setzt das Modell mehr Gewicht auf ältere Daten in seinem Schätzung des aktuellen Niveaus und des Tendenzes und seine langfristigen Prognosen spiegeln den in den letzten 5 Jahren beobachteten Abwärtstrend und nicht den jüngsten Aufwärtstrend dar. Diese Grafik zeigt auch deutlich, wie das Modell mit einem kleineren Wert von Alpha langsamer reagiert Wendepunkte in den Daten und neigt daher dazu, für viele Perioden in einer Reihe einen Fehler des gleichen Vorzeichens zu machen. Die pro-Schritt-Prognosefehler sind im Durchschnitt größer als die, die vor RMSE von 34 4 statt 27 4 und stark positiv autokorreliert wurden Die Lag-1-Autokorrelation von 0 56 übersteigt den oben berechneten Wert von 0 33 für eine statistisch signifikante Abweichung von Null. Als Alternative zum Anfahren des Wertes von alpha, um mehr Konservatismus in langfristige Prognosen einzuführen, ist ein Trenddämpfungsfaktor Wird manchmal dem Modell hinzugefügt, um den projizierten Trend nach wenigen Perioden abzubauen. Der letzte Schritt beim Aufbau des Prognosemodells besteht darin, die LES-Prognosen durch Multiplikation mit den entsprechenden saisonalen Indizes zu verwerten. So werden die in der Spalte I vorangegangenen Prognosen Sind einfach das Produkt der saisonalen Indizes in Spalte F und die saisonbereinigten LES-Prognosen in Spalte H. Es ist relativ einfach, Konfidenzintervalle für einstufige Prognosen zu berechnen, die von diesem Modell gemacht werden, zuerst den RMSE-Wurzel-Mittel-Quadrat-Fehler zu berechnen , Das ist nur die Quadratwurzel des MSE und berechnet dann ein Konfidenzintervall für die saisonbereinigte Prognose durch Addition und Subtraktion zweimal der RMSE Im Allgemeinen ist ein 95-Konfidenzintervall für eine Prognose von einer Periode vorausgehend gleich der Punktvorhersage Plus-oder-minus-zwei mal die geschätzte Standardabweichung der Prognosefehler unter der Annahme, dass die Fehlerverteilung annähernd normal ist und die Stichprobengröße groß genug ist, z. B. 20 oder mehr Hier ist die RMSE anstelle der Stichproben-Standardabweichung der Fehler Ist die beste Schätzung der Standardabweichung der zukünftigen Prognosefehler, da es Bias sowie zufällige Variationen berücksichtigt. Die Konfidenzgrenzen für die saisonbereinigte Prognose werden dann zusammen mit der Prognose neu vervielfacht, indem sie mit den entsprechenden saisonalen Indizes multipliziert werden RMSE ist gleich 27 4 und die saisonbereinigte Prognose für die erste zukünftige Periode Dez-93 ist 273 2 so ist das saisonbereinigte 95 Konfidenzintervall von 273 2-2 27 4 218 4 bis 273 2 2 27 4 328 0 Multiplikation dieser Grenzen Bis Dezember saisonalen Index von 68 61 erhalten wir niedrigere und obere Konfidenzgrenzen von 149 8 und 225 0 um die Dez-93-Punkt-Prognose von 187 4.Confidence-Limits für Prognosen mehr als eine Periode im Voraus wird im Allgemeinen erweitern, wie der Prognosehorizont erhöht, Aufgrund der Ungewissheit über das Niveau und den Trend sowie die saisonalen Faktoren, aber es ist schwierig, sie im Allgemeinen durch analytische Methoden zu berechnen. Der richtige Weg, um Vertrauensgrenzen für die LES-Prognose zu berechnen, ist die Verwendung der ARIMA-Theorie, aber die Unsicherheit in der Saison Indizes sind eine andere Sache Wenn Sie ein realistisches Konfidenzintervall für eine Prognose mehr als einen Zeitraum voran wollen, wobei alle Fehlerquellen berücksichtigt werden, ist Ihre beste Wette, empirische Methoden zum Beispiel zu verwenden, um ein Konfidenzintervall für einen 2-Schritt voraus zu erhalten Prognose, können Sie eine weitere Spalte auf der Kalkulationstabelle erstellen, um eine 2-Schritt-voraus-Prognose für jeden Zeitraum zu berechnen, indem Sie die Ein-Schritt-Voraus-Prognose booten. Dann rechnen Sie die RMSE der 2-Schritt-voraus Prognose Fehler und verwenden Sie diese als Grundlage Für ein 2-Schritt-voraus Vertrauensintervall.2 Zeitreihen-Zerlegung In diesem Abschnitt untersuchen wir Methoden zur Analyse der Struktur einer Zeitreihe Streng diese Techniken sind nicht Vorhersage Methoden, aber sie werden hilfreich sein und werden in der tatsächlichen Prognose Methoden eingesetzt werden Der Grundansatz bei der Analyse der zugrunde liegenden Struktur einer Zeitreihe besteht darin, sie zu zerlegen, wo Y t der beobachtete Wert zum Zeitpunkt tS t ist, ist die saisonale Komponente zum Zeitpunkt tT t die Trendzykluskomponente zum Zeitpunkt tE t ist ein Unregelmäßige zufällige Komponente zum Zeitpunkt t. Es gibt mehrere Formen, die die Funktionsform f nehmen kann.2 1 Additive und multiplikative Modelle. Wir haben eine additive Zersetzung if. We haben eine multiplikative Zersetzung if. This kann in ein additives Modell umgewandelt werden, indem sie Logarithmen, als ob Y t S t T t E t dann. Es ist wichtig, um die Komponenten separat für Vergleichszwecke zu zeichnen. Für das additive Modell ist es üblich, auf saisonbereinigte Daten durch Subtraktion der saisonalen Komponente aus den Beobachtungen konzentrieren. Die saisonale Komponente ist nicht bekannt und muss geschätzt werden, so dass die saisonbereinigten Daten die Form Y t nehmen werden. Hier und im Folgenden verwenden wir einen Zirkumflex, um eine Schätzung zu bezeichnen. Ein wichtiger Punkt ist, dass bei der Analyse einer Zeitreihe meist besser geht Um den Trendzyklus zu schätzen, dann schätzen wir die Saisonalität. Aber auch hier ist es am besten, die Wirkung der unregelmäßigen Komponente durch Glättung der Daten zu reduzieren. So ist dies in der Regel zuerst getan. Man kann grundsätzlich die Glättung als durchgeführt ausführen Entfernen Sie die Wirkung der Unregelmäßigkeit alleine Dies wird sowohl die Zeit-und Saison-Komponenten, die dann zu unterscheiden müssen, von einander zu unterscheiden. Jedoch, wenn eine saisonale Komponente erwartet wird, dann ist es üblicher, die Glättung in solchen gelten Eine Art und Weise, dass sowohl die saisonale Komponente als auch die unregelmäßige Komponente entfernt werden. Damit bleibt dann nur der Trendzyklus, der so identifiziert wird. Mit diesem letzteren Ansatz können wir dann den Trendzyklus sofort durch Subtraktion entfernen und dann die Saisonalität identifizieren Diese de-trended Zeitreihe Es ist zu beachten, dass Glättung nur eine Schätzung der Trend-Zyklus produziert. Die de-trended Zeitreihen sollten strikt geschrieben werden wie. Wir werden in Kürze diese Identifizierung der Saisonalität aus einer de-Trend-Zeitreihe zu sehen Oder aus einer Zeitreihe, in der es keinen Trendzyklus an erster Stelle gab, ist einfach.2 2 1 Moving Average. Ein einfacher Weg, um Glättung durchzuführen, ist, einen gleitenden Durchschnitt zu verwenden. Die Grundidee ist die Werte der Beobachtungen, die sind In der zeit eng zusammenhängen werden Trendzyklus-Komponenten haben, die im Wert der Ignorierung der saisonalen Komponente für den Augenblick ähnlich sind, kann der Wert der Trend-Zyklus-Komponente zu einem bestimmten Zeitpunkt dann erhalten werden, indem man einen Durchschnitt von einer Reihe von Beobachtungen über Dieser Zeitpunkt Weil die Werte, die gemittelt werden, vom Zeitpunkt abhängen, wird dies als gleitender Durchschnitt bezeichnet. Es gibt viele verschiedene Formen, die ein gleitender Durchschnitt nehmen kann Viele wurden mit Ad-hoc-Argumenten und Argumentation konstruiert. Alle kochen, um etwas zu sein Fälle von dem, was man einen k-Punkt gewichteten gleitenden Durchschnitt nennt. Wo mk -1 2 heißt die halbe Breite und die aj werden die Gewichte genannt. Hinweis, dass in dieser Definition k eine ungerade Zahl sein muss Die einfachsten Versionen sind die wo alle Die Gewichte sind gleich Das heißt dann ein einfacher gleitender Durchschnitt der Ordnung k. Wenn die Gewichte symmetrisch um den Mittelwert, dh etwa j 0 in der Summe, ausgeglichen werden, dann wird dies als zentrierter gleitender Durchschnitt bezeichnet. Einfache Bewegungsdurchschnitte mit einer gleichmäßigen Anzahl der Begriffe können verwendet werden, sind aber dann nicht um eine ganze Zahl t zentriert. Dies kann durch Mittelwertbildung ein zweites Mal nur mit der Mittelung der sich bewegenden Mittelwerte selbst beseitigt werden. So z. B. wenn zwei aufeinanderfolgende 4-Punkt-Bewegungsdurchschnitte sind, dann können wir Zentrieren sie, indem sie ihren Durchschnitt nehmen. Dieses Beispiel heißt 24 MA Es ist einfach ein 5-Punkt gewichteter gleitender Durchschnitt, mit Endgewichten je 1 8 und mit den anderen drei Gewichten. Wenn auf vierteljährliche Daten angewendet, würde diese 24 MA Gaben allen vier Quartalen gleiches Gewicht, da die 1. und letzten Werte für das gleiche Quartal, aber in verschiedenen Jahren gelten würden. So würde diese glattere vierteljährliche saisonale Variation glätten. Ähnlich würde ein 212 MA saisonale Variation in monatlichen Daten glätten. Übung 2 1 Was sind die Gewichte eines 212 MA glatter. Es gibt eine Reihe von Gewichtung Schemata vorgeschlagen Alle neigen dazu, Gewichtswerte, die Schwanz in Richtung der beiden Enden der Summation auch sie sind in der Regel symmetrisch mit aja - j Es gibt ein Problem mit einem Umzug Durchschnitt an den beiden Enden einer Zeitreihe, wenn wir aus Beobachtungen auslaufen, um die vollständige Summierung zu berechnen Wenn weniger als k Beobachtungen vorhanden sind, werden die Gewichte in der Regel umkaliert, so dass sie zu einer Einheit zusammenfließen. Ein Effekt eines gleitenden Durchschnitts ist, dass es unterschätzen wird Trends an den Enden einer Zeitreihe Dies bedeutet, dass die bisher diskutierten Methoden für die Prognosezwecke in der Regel unbefriedigend sind, wenn ein Trend vorliegt. In diesem Abschnitt betrachten wir die sogenannte klassische Zersetzung. Dies sind die in den 1920er Jahren entwickelten Methoden, Basis der typischen vorhandenen Zersetzungsmethoden Die Betrachtung der additiven und der multiplikativen Fälle und wo die saisonale Periode 12,2 3 1 additive Zersetzung ist. Dies ist für den Fall, wo YTSE Die klassische Zerlegung dauert vier Schritte. Schritt 1 Berechnen Sie die zentrierte 12 MA Bezeichnen Sie diese Serie Von M t Diese Serie schätzt den Trend-Zyklus. Schritt 2 De-Trend die Original-Serie durch Subtraktion. Schritt 3 Berechnen Sie einen saisonalen Index für jeden Monat, indem Sie den Durchschnitt aller Werte jeden Monat, j. In dieser Formel ist es Angenommen, dass es für den Monat j nj-Werte gibt, so dass die Summation über diese nj-Werte liegt. Schritt 4 Die geschätzte Unregelmäßigkeit wird durch Subtraktion der saisonalen Komponente aus der de-trendigen Serie erhalten. Hierbei handelt es sich um den saisonalen Index für den Monat, der entspricht Beobachtung Y t.2 3 2 Multiplikative Zersetzung. Für das multiplikative Modell YTSE wird die Methode das Verhältnis der tatsächlichen zu den gleitenden Mitteln genannt. Es gibt wieder vier Schritte. Schritt 1 Berechnen Sie die zentrierte 12 MA Bezeichnen Sie diese Serie von M t Dieser Schritt ist genau das Das gleiche wie in der additiven Modell case. Step 2 Berechnen Sie R t das Verhältnis von tatsächlichen zu gleitenden Durchschnitten. Schritt 3 Berechnen Sie einen saisonalen Index für jeden Monat, indem Sie den Durchschnitt aller Werte jeden Monat, j. This Schritt ist genau das gleiche wie In der additiven Fall außer, dass D durch R. Step ersetzt wird 4 Berechnen. Exercise 2 3 Analysieren Sie das Haus Verkaufsdaten mit dem additiven Modell Plot der Trend-Zyklus, saisonale und unregelmäßige Schätzungen. Hinweis Diese Übung gibt Ihnen Praxis bei der Verwendung der Pivot-Tabelle Um die saisonalen Anpassungen zu berechnen. Übung 2 4 Analysieren Sie die International Airline Daten mit dem multiplikativen Modell Plot der Trend-Zyklus, saisonale und unregelmäßige Schätzungen Web International Airline Data. General saisonale ARIMA Modelle 0,1,1 x 0,1,1 etc. Umriss der saisonalen ARIMA-Modellierung. Der saisonale Teil eines ARIMA-Modells hat die gleiche Struktur wie die nicht-saisonale Teil kann es einen AR-Faktor, einen MA-Faktor, und oder eine Reihenfolge der Differenzierung Im saisonalen Teil des Modells, alle von Diese Faktoren arbeiten über Vielfache der Verzögerung der Anzahl der Perioden in einer Saison. Ein saisonales ARIMA-Modell wird als ARIMA p, d, qx P, D, Q-Modell klassifiziert, wobei P Anzahl der saisonalen autoregressiven SAR-Terme, D-Zahl von saisonalen Unterschiede, Q Anzahl der saisonalen gleitenden durchschnittlichen SMA Begriffe. In der Identifizierung eines saisonalen Modells, ist der erste Schritt zu bestimmen, ob ein saisonaler Unterschied benötigt wird, zusätzlich oder vielleicht statt einer nicht-saisonalen Unterschied Sie sollten sich Zeitreihen Plots und ACF - und PACF-Plots für alle möglichen Kombinationen von 0 oder 1 nicht-saisonalen Unterschied und 0 oder 1 saisonalen Unterschied Vorsicht don t EVER verwenden mehr als ONE saisonalen Unterschied, noch mehr als ZWEI Gesamtdifferenzen saisonale und nicht-saisonale kombiniert. Wenn die Saisonale Muster ist sowohl stark und stabil über die Zeit zB hoch im Sommer und niedrig im Winter, oder umgekehrt, dann sollten Sie wahrscheinlich einen saisonalen Unterschied verwenden, unabhängig davon, ob Sie einen nicht-saisonalen Unterschied verwenden, da dies das saisonale Muster zu verhindern Aus dem Aussterben in den langfristigen Prognosen Lassen Sie uns dies zu unserer Liste der Regeln für die Identifizierung von Modellen hinzufügen. Rule 12 Wenn die Serie hat eine starke und konsequente saisonale Muster, dann sollten Sie eine Reihenfolge der saisonalen differencing verwenden - aber nie mehr verwenden Als eine Reihenfolge der saisonalen Differenzierung oder mehr als 2 Ordnungen von insgesamt differenzierenden saisonalen Nichtsaison. Die Signatur des reinen SAR oder reinen SMA Verhalten ist ähnlich wie die Signatur von reinen AR oder reine MA Verhalten, außer dass das Muster über Vielfache von lag s in Die ACF und PACF. Für Beispiel, ein reines SAR 1-Prozess hat Spikes in der ACF an den Verzögerungen s, 2s, 3s, etc, während die PACF schneidet nach Verzögerung s. Conversely, ein reines SMA 1-Prozess hat Spikes in der PACF an Verzögerungen S, 2s, 3s usw., während der ACF nach der Verzögerung abschaltet. Eine SAR-Signatur tritt gewöhnlich auf, wenn die Autokorrelation zum Saisonzeitpunkt positiv ist, während eine SMA-Signatur normalerweise auftritt, wenn die saisonale Autokorrelation negativ ist Autokorrelation in der Saisonperiode ist positiv erwägen Hinzufügen eines SAR-Begriffs zum Modell Wenn die Autokorrelation in der Saisonperiode negativ ist, erwägen, einen SMA-Begriff zum Modell hinzuzufügen Versuchen Sie, das Mischen von SAR - und SMA-Terme im selben Modell zu vermeiden und vermeiden Sie mehr als Einer von jeder Art. Usually ein SAR 1 oder SMA 1 Begriff ist ausreichend Sie werden selten einen echten SAR 2 oder SMA 2 Prozess begegnen, und noch seltener haben genug Daten, um 2 oder mehr saisonale Koeffizienten zu schätzen, ohne dass der Schätzalgorithmus in ein Feedback kommt Schleife. Obwohl ein saisonales ARIMA-Modell nur wenige Parameter zu haben scheint, denken Sie daran, dass Backforecasting die Schätzung von ein oder zwei Jahreszeiten im Wert von impliziten Parametern erfordert, um es zu initialisieren. Daher sollten Sie mindestens 4 oder 5 Jahreszeiten von Daten haben, um saisonal zu passen ARIMA-Modell. Möglicherweise ist das am häufigsten verwendete saisonale ARIMA-Modell das 0,1,1 x 0,1,1 Modell - dh ein MA 1 xSMA 1 Modell mit saisonalen und nicht saisonalen Unterschied Dies ist im Wesentlichen eine saisonale Exponential Glättung Modell. Wenn saisonale ARIMA-Modelle sind auf logged Daten montiert, sind sie in der Lage, eine multiplikative saisonale Muster. Example AUTOSALE Serie revisited. Recall, dass wir vorher prognostiziert die Einzelhandel Auto Sales-Serie, indem Sie eine Kombination von Deflation, saisonale Anpassung und exponentielle Glättung Lassen Sie uns jetzt versuchen, die gleiche Serie mit saisonalen ARIMA-Modellen anzupassen, indem Sie die gleiche Stichprobe von Daten von Januar 1970 bis Mai 1993 verwenden. 281 Beobachtungen Wie zuvor arbeiten wir mit deflationierten Autoverkäufen - dh wir verwenden die Serie AUTOSALE CPI als Eingangsvariable Hier sind die Zeitreihenplots und ACF - und PACF-Plots der Originalreihe, die im Prognoseverfahren erhalten werden, indem die Residuen eines ARIMA 0,0,0 x 0,0,0 Modells mit Konstanten aufgetragen werden Die ACF ist typisch für eine Reihe, die sowohl nonstationary als auch stark saisonal ist. Klarlich brauchen wir mindestens eine Reihenfolge der Differenzierung Wenn wir einen nicht-seasonalen Unterschied nehmen, sind die entsprechenden Plots wie folgt. Die differenzierten Reihen der Residuen eines zufälligen Walk-with - Wachstumsmodell sieht mehr oder weniger stationär aus, aber es gibt immer noch sehr starke Autokorrelation in der Saisonperiode Verzögerung 12. Weil das saisonale Muster stark und stabil ist, wissen wir aus Regel 12, dass wir eine Reihenfolge der saisonalen Differenzierung in verwenden wollen Das Modell Hier ist, was das Bild nach einem saisonalen Unterschied nur aussieht. Die saisonal differenzierte Serie zeigt ein sehr starkes Muster positiver Autokorrelation, wie wir uns von unserem früheren Versuch erinnern, ein saisonales zufälliges Spaziergangmodell zu passen. Dies könnte eine AR-Signatur sein - Oder es könnte die Notwendigkeit für einen anderen Unterschied signalisieren. Wenn wir sowohl eine saisonale und nicht-seasonal Unterschied nehmen, werden folgende Ergebnisse erhalten. Dies sind natürlich die Residuen aus dem saisonalen zufälligen Trend-Modell, das wir an die Auto-Verkaufsdaten früher Wir jetzt Sehen Sie die verräterischen Zeichen der leichten Überdifferenzierung der positiven Spikes in der ACF und PACF sind negativ geworden. Was ist die richtige Reihenfolge der Differenzierung Eine weitere Information, die hilfreich sein könnte, ist eine Berechnung der Fehlerstatistiken der Serie auf jeder Ebene der Differenzierung Wir können diese durch Anpassen der entsprechenden ARIMA-Modelle berechnen, in denen nur differenziert wird. Die kleinsten Fehler sowohl in der Schätzperiode als auch in der Validierungsperiode werden durch das Modell A erhalten, das eine Differenz jedes Typs verwendet. Dies zusammen mit dem Aussehen von Die Plots oben, deutet stark darauf hin, dass wir sowohl einen saisonalen als auch einen nicht-seasonalen Unterschied verwenden sollten. Beachten Sie, dass mit Ausnahme des gratuitiven konstanten Begriffs Modell A das saisonale zufällige Trend-SRT-Modell ist, während Modell B nur der saisonale zufällige Schritt SRW-Modell ist Dass das SRT-Modell besser als das SRW-Modell zu sehen scheint. In der folgenden Analyse werden wir versuchen, diese Modelle durch die Hinzufügung von saisonalen ARIMA-Begriffen zu verbessern. Zurück zum Seitenanfang Die oft verwendete ARIMA 0 , 1,1 x 0,1,1 Modell SRT Modell plus MA 1 und SMA 1 Ausdrücke. Rückkehr zum letzten Satz von Plots oben, beachten Sie, dass mit einem Unterschied von jedem Typ gibt es eine negative Spitze in der ACF bei lag 1 und Auch eine negative Spike im ACF bei Verzögerung 12, während die PACF ein allmähliches Abklingmuster in der Nähe dieser beiden Verzögerungen zeigt. Durch Anwendung unserer Regeln zur Identifizierung von ARIMA-Modellen, Regel 7 und Regel 13, können wir nun schließen, dass das SRT-Modell Würde durch die Hinzufügung eines MA 1-Termes und auch eines SMA 1-Termes verbessert werden. Auch nach Regel 5 schließen wir die Konstante aus, da zwei Ordnungen der Differenzierung beteiligt sind. Wenn wir das alles tun, erhalten wir die ARIMA 0,1,1 x 0,1,1 Modell, das das am häufigsten verwendete saisonale ARIMA-Modell ist. Seine Prognosegleichung ist. wo 1 ist der MA 1 Koeffizient und 1 Kapital Theta-1 ist der SMA 1 Koeffizient Beachten Sie, dass dies nur das saisonale zufällige Trendmodell ist, Up durch Hinzufügen von Vielfachen der Fehler bei den Verzögerungen 1, 12 und 13 Außerdem ist zu bemerken, dass der Koeffizient des Lag-13-Fehlers das Produkt der MA 1 - und SMA 1-Koeffizienten ist. Dieses Modell ist konzeptionell ähnlich dem Winters-Modell, insofern es sicherstellt Effektiv wirkt auf exponentielle Glättung auf Niveau, Trend und Saisonalität auf einmal, obwohl es auf festeren theoretischen Grundlagen beruht, vor allem im Hinblick auf die Berechnung der Konfidenzintervalle für langfristige Prognosen. Ist Rest-Plots in diesem Fall sind wie folgt. Obwohl eine leichte Die Anzahl der Autokorrelation bleibt bei der Verzögerung 12, das Gesamtbild der Plots ist gut Die Modellanpassungsergebnisse zeigen, dass die geschätzten MA 1 - und SMA 1-Koeffizienten, die nach 7 Iterationen erhalten wurden, tatsächlich signifikant sind. Die Prognosen des Modells ähneln denen des saisonalen zufälligen Trends Modell - dh sie holen das saisonale Muster und den lokalen Trend am Ende der Serie - aber sie sind etwas glatter im Aussehen, da sowohl das saisonale Muster als auch der Trend effektiv in einer exponentiell-glättenden Art und Weise gemittelt werden Die letzten paar Jahreszeiten. Was ist dieses Modell wirklich tun Sie können es in der folgenden Weise denken Zuerst berechnet es den Unterschied zwischen jedem Monat s Wert und einem exponentiell gewichteten historischen Durchschnitt für diesen Monat, die durch die Anwendung exponentielle Glättung auf Werte, die waren berechnet Beobachtet im selben Monat in den vergangenen Jahren, wo die Menge der Glättung durch den SMA 1 Koeffizienten bestimmt wird. Dann gilt eine einfache exponentielle Glättung dieser Unterschiede, um die Abweichung vom historischen Durchschnitt, die im nächsten Monat beobachtet wird, vorherzusagen. Der Wert der SMA 1 Koeffizient nahe 1 0 deutet darauf hin, dass viele Jahreszeiten der Daten verwendet werden, um den historischen Durchschnitt für einen bestimmten Monat des Jahres zu berechnen. Erinnern Sie sich, dass ein MA 1 Koeffizient in einem ARIMA 0,1,1 Modell 1-minus-alpha in entspricht Das entsprechende exponentielle Glättungsmodell, und dass das Durchschnittsalter der Daten in einer exponentiellen Glättungsmodellvorhersage 1 alpha ist. Der SMA 1 Koeffizient hat eine ähnliche Interpretation in Bezug auf Mittelwerte über Jahreszeiten. Hier bedeutet der Wert von 0 91, dass das Durchschnittsalter der Daten, die für die Schätzung des historischen Saisonmusters verwendet werden, sind ein bisschen mehr als 10 Jahre fast die Hälfte der Länge des Datensatzes, was bedeutet, dass ein fast konstantes Saisonmuster angenommen wird. Der viel kleinere Wert von 0 5 für den MA 1 Koeffizienten deutet darauf hin, dass relativ Es wird wenig Glättung getan, um die gegenwärtige Abweichung vom historischen Durchschnitt für denselben Monat abzuschätzen, so dass die vorhergehende Abweichung des nächsten Monats von seinem historischen Durchschnitt nahe an den Abweichungen vom historischen Durchschnitt liegt, die in den letzten Monaten beobachtet wurden. Die ARIMA 1,0,0 x 0,1,0 Modell mit konstantem SRW Modell plus AR 1 Term. Das Vorgängermodell war ein saisonales Random Trend SRT Modell, das durch den Zusatz von MA 1 und SMA 1 Koeffizienten abgestimmt wurde. Ein alternatives ARIMA Modell dafür Serie kann durch Substitution eines AR 1-Termes für den nicht-seasonalen Unterschied - dh durch Hinzufügen eines AR 1-Termes zum saisonalen Random Walk SRW-Modell erhalten werden. Dies ermöglicht es uns, das saisonale Muster im Modell zu bewahren, während die Gesamtmenge der Differenzierung, Wodurch die Stabilität der Trendprojektionen erweitert wird, falls gewünscht, erinnern wir uns, dass mit einer saisonalen Differenz allein die Serie eine starke AR 1 Signatur gezeigt hat. Wenn wir dies tun, erhalten wir ein ARIMA 1,0,0 x 0,1,0 Modell mit konstantem , Was die folgenden Ergebnisse ergibt: Der AR 1 - Koeffizient ist in der Tat sehr signifikant und der RMSE ist nur 2 06, verglichen mit 3 00 für das SRW-Modell Modell B im Vergleichsbericht oben Die Prognosegleichung für dieses Modell ist. Der zusätzliche Term Auf der rechten Seite ist ein Vielfaches der saisonalen Differenz, die im letzten Monat beobachtet wurde, was die Korrektur der Prognose für die Wirkung eines ungewöhnlich guten oder schlechten Jahres bewirkt. Hier bezeichnet 1 den AR 1 - Koeffizienten, dessen Schätzwert liegt 0 73 So zum Beispiel, wenn Umsatz im vergangenen Monat waren X Dollar vor Umsatz ein Jahr zuvor, dann die Menge 0 73X würde hinzugefügt werden, um die Prognose für diesen Monat bezeichnet die CONSTANT in der Prognose Gleichung, deren Schätzwert ist 0 20 Die Geschätzte MEAN, deren Wert 0 75 ist, ist der Mittelwert der saisonal differenzierten Serien, was der jährliche Trend in den Langzeitprognosen dieses Modells ist. Die Konstante ist definitionsgemäß gleich der mittleren Zeit 1 minus dem AR 1 Koeffizienten 0 2 0 75 1 0 73. Die prognostizierte Handlung zeigt, dass das Modell in der Tat einen besseren Job als das SRW-Modell der Verfolgung zyklischer Veränderungen, dh ungewöhnlich gute oder schlechte Jahre. Jedoch ist die MSE für dieses Modell ist immer noch deutlich größer als das, was wir für erhalten haben Das ARIMA 0,1,1 x 0,1,1 Modell Wenn wir die Plätze der Residuen betrachten, sehen wir Raum für Verbesserungen Die Residuen zeigen immer noch ein Zeichen der zyklischen Variation. ACF und PACF schlagen die Notwendigkeit für MA 1 und SMA 1 Koeffizienten. Eine verbesserte Version ARIMA 1,0,1 x 0,1,1 mit Konstante. Wenn wir die angegebenen MA 1 und SMA 1 Begriffe zum vorhergehenden Modell hinzufügen, erhalten wir eine ARIMA 1,0,1 x 0, 1,1 Modell mit Konstante, deren Prognose Gleichung ist. Dies ist fast das gleiche wie die ARIMA 0,1,1 x 0,1,1 Modell, außer dass es ersetzt die Nicht-Sektion Unterschied mit einem AR 1 Begriff eine partielle Differenz und es enthält Ein konstanter Begriff, der den langfristigen Trend repräsentiert. Daher nimmt dieses Modell einen stabileren Trend als das Modell ARIMA 0,1,1 x 0,1,1 an, und das ist der Hauptunterschied zwischen ihnen. Die modellbasierten Ergebnisse sind wie folgt follows. Notice that the estimated AR 1 coefficient 1 in the model equation is 0 96, which is very close to 1 0 but not so close as to suggest that it absolutely ought to be replaced with a first difference its standard error is 0 02, so it is about 2 standard errors from 1 0 The other statistics of the model the estimated MA 1 and SMA 1 coefficients and error statistics in the estimation and validation periods are otherwise nearly identical to those of the ARIMA 0,1,1 x 0, 1,1 model The estimated MA 1 and SMA 1 coefficients are 0 45 and 0 91 in this model vs 0 48 and 0 91 in the other. The estimated MEAN of 0 68 is the predicted long-term trend average annual increase This is essentially the same value that was obtained in the 1,0,0 x 0,1,0 - with-constant model The standard error of the estimated mean is 0 26, so the difference between 0 75 and 0 68 is not significant. If the constant was not included in this model, it would be a damped-trend model the trend in its very-long-term forecasts would gradually flatten out. The point forecasts from this model look quite similar to those of the 0,1,1 x 0,1,1 model, because the average trend is similar to the local trend at the end of the series However, the confidence intervals for this model widen somewhat less rapidly because of its assumption that the trend is stable Notice that the confidence limits for the two-year-ahead forecasts now stay within the horizontal grid lines at 24 and 44, whereas those of the 0,1,1 x 0,1,1 model did not. Seasonal ARIMA versus exponential smoothing and seasonal adjustment Now let s compare the performance the two best ARIMA models against simple and linear exponential smoothing models accompanied by multiplicative seasonal adjustment, and the Winters model, as shown in the slides on forecasting with seasonal adjustment. The error statistics for the one-period-ahead forecasts for all the models are extremely close in this case It is hard to pick a winner based on these numbers alone Return to top of page. What are the tradeoffs among the various seasonal models The three models that use multiplicative seasonal adjustment deal with seasonality in an explicit fashion - - ie seasonal indices are broken out as an explicit part of the model The ARIMA models deal with seasonality in a more implicit manner--we can t easily see in the ARIMA output how the average December, say, differs from the average July Depending on whether it is deemed important to isolate the seasonal pattern, this might be a factor in choosing among models The ARIMA models have the advantage that, once they have been initialized, they have fewer moving parts than the exponential smoothing and adjustment models and as such they may be less likely to overfit the data ARIMA models also have a more solid underlying theory with respect to the calculation of confidence intervals for longer-horizon forecasts than do the other models. There are more dramatic differences among the models with respect to the behavior of their forecasts and confidence intervals for forecasts more than 1 period into the future This is where the assumptions that are made with respect to changes in the trend and seasonal pattern are very important. Between the two ARIMA models, one model A estimates a time-varying trend, while the other model B incorporates a long-term average trend We could, if we desired, flatten out the long-term trend in model B by suppressing the constant term Among the exponential-smoothing-plus-adjustment models, one model C assumes a flat trend, while the other model D assumes a time-varying trend The Winters model E also assumes a time-varying trend. Models that assume a constant trend are relatively more confident in their long-term forecasts than models that do not, and this will usually be reflected in the extent to which confidence intervals for forecasts get wider at longer forecast horizons Models that do not assume time-varying trends generally have narrower confidence intervals for longer-horizon forecasts, but narrower is not better unless this assumption is correct. The two exponential smoothing models combined with seasonal adjustment assume that the seasonal pattern has remained constant over the 23 years in the data sample, while the other three models do not Insofar as the seasonal pattern accounts for most of the month-to-month variation in the data, getting it right is important for forecasting what will happen several months into the future If the seasonal pattern is believed to have changed slowly over time, another approach would be to just use a shorter data history for fitting the models that estimate fixed seasonal indices. For the record, here are the forecasts and 95 confidence limits for May 1995 24 months ahead that are produced by the five models. The point forecasts are actually surprisingly close to each other, relative to the widths of all the confidence intervals The SES point forecast is the lowest, because it is the only model that does not assume an upward trend at the end of the series The ARIMA 1,0,1 x 0,1,1 c model has the narrowest confidence limits, because it assumes less time-variation in the parameters than the other models Also, its point forecast is slightly larger than those of the other models, because it is extrapolating a long-term trend rather than a short-term trend or zero trend. The Winters model is the least stable of the models and its forecast therefore has the widest confidence limits, as was apparent in the detailed forecast plots for the models And the forecasts and confidence limits of the ARIMA 0,1,1 x 0,1,1 model and those of the LES seasonal adjustment model are virtually identical. To log or not to log Something that we have not yet done, but might have, is include a log transformation as part of the model Seasonal ARIMA models are inherently additive models, so if we want to capture a multiplicative seasonal pattern we must do so by logging the data prior to fitting the ARIMA model In Statgraphics, we would just have to specify Natural Log as a modeling option--no big deal In this case, the deflation transformation seems to have done a satisfactory job of stabilizing the amplitudes of the seasonal cycles, so there does not appear to be a compelling reason to add a log transformation as far as long term trends are concerned If the residuals showed a marked increase in variance over time, we might decide otherwise. There is still a question of whether the errors of these models have a consistent variance across months of the year If they don t, then confidence intervals for forecasts might tend to be too wide or too narrow according to the season The residual - vs-time plots do not show an obvious problem in this regard, but to be thorough, it would be good to look at the error variance by month If there is indeed a problem, a log transformation might fix it Return to top of page .
Comments
Post a Comment