Friday 24 November 2017

Moving Media Pdf


Introduzione ai ARIMA: modelli non stagionali ARIMA (p, d, q) equazione di previsione: modelli ARIMA sono, in teoria, la classe più generale di modelli per la previsione di una serie di tempo che può essere fatto per essere 8220stationary8221 dalla differenziazione (se necessario), forse unitamente trasformazioni non lineari come registrazione o sgonfiando (se necessario). Una variabile casuale che è una serie temporale è stazionaria se le sue proprietà statistiche sono tutte costanti nel tempo. Una serie stazionaria ha alcuna tendenza, le sue variazioni intorno la sua media hanno una ampiezza costante, e dimena in modo coerente. ossia suoi schemi temporali casuale breve termine sempre lo stesso aspetto in senso statistico. Quest'ultima condizione implica che le sue autocorrelazioni (correlazioni con i propri precedenti deviazioni dalla media) rimangono costanti nel tempo, o equivalentemente, che il suo spettro di potenza rimane costante nel tempo. Una variabile casuale di questa forma può essere visto (come al solito) come una combinazione di segnale e rumore, e il segnale (se risulta) potrebbe essere un modello di regressione medio veloce o lento, o oscillazione sinusoidale, o rapida alternanza di segno , e potrebbe anche avere una componente stagionale. Un modello ARIMA può essere visto come un 8220filter8221 che cerca di separare il segnale dal rumore, e il segnale viene poi estrapolato nel futuro per ottenere delle previsioni. L'equazione di previsione ARIMA per una serie temporale stazionaria è un lineare (cioè la regressione-tipo) equazione in cui i predittori sono costituiti da ritardi della variabile dipendente Andor ritardi degli errori di previsione. Cioè: Valore atteso di Y un andor costante una somma pesata di uno o più valori recenti di Y eo una somma pesata di uno o più valori recenti degli errori. Se i predittori sono costituiti solo di valori ritardati di Y. si tratta di un modello autoregressivo puro (8220self-regressed8221), che è solo un caso particolare di un modello di regressione e che potrebbe essere dotato di un software di regressione standard. Ad esempio, un autoregressiva del primo ordine (8220AR (1) 8221) modello per Y è un modello di regressione semplice in cui la variabile indipendente è semplicemente Y ritardato di un periodo (GAL (Y, 1) in Statgraphics o YLAG1 in RegressIt). Se alcuni dei fattori predittivi sono ritardi degli errori, un modello ARIMA NON è un modello di regressione lineare, perché non c'è modo di specificare period8217s 8220last error8221 come una variabile indipendente: gli errori devono essere calcolati su base periodica-to-periodo quando il modello è montato dati. Dal punto di vista tecnico, il problema con l'utilizzo errori ritardati come predittori è che le previsioni model8217s non sono funzioni lineari dei coefficienti. anche se sono funzioni lineari dei dati passati. Così, i coefficienti nei modelli ARIMA che includono errori ritardati devono essere stimati con metodi di ottimizzazione non lineare (8220hill-climbing8221) piuttosto che da solo risolvere un sistema di equazioni. L 'acronimo ARIMA sta per Auto-regressiva integrato media mobile. Ritardi della serie stationarized nell'equazione di previsione sono chiamati termini quotautoregressivequot, ritardi della errori di previsione sono chiamati quotmoving termini averagequot, e una serie di tempo che deve essere differenziata da effettuare stazionaria si dice che sia una versione quotintegratedquot di una serie stazionaria. modelli casuali di tendenza modelli di livellamento esponenziale casuale passeggiata e, modelli autoregressivi, e sono tutti i casi particolari di modelli ARIMA. Un modello ARIMA nonseasonal è classificato come (p, d, q) modello quot quotARIMA, dove: p è il numero di termini autoregressivi, d è il numero di differenze non stagionali necessari per stazionarietà, e q è il numero di errori di previsione ritardati in l'equazione di previsione. L'equazione di previsione è costruito come segue. In primo luogo, Sia Y il d ° differenza di Y. che significa: Si noti che la seconda differenza di Y (il caso d2) non è la differenza da 2 periodi fa. Piuttosto, è la prima differenza-of-the-prima differenza. che è l'analogo discreto di una derivata seconda, cioè l'accelerazione locale della serie piuttosto che la sua tendenza locale. In termini di y. l'equazione generale di previsione è: Qui i parametri medi in movimento (9528217s) sono definiti in modo tale che i loro segni sono negativi nell'equazione, seguendo la convenzione introdotta da Box e Jenkins. Alcuni autori e software (incluso il linguaggio di programmazione R) definirli in modo che abbiano segni più, invece. Quando i numeri reali sono inseriti nell'equazione, non c'è ambiguità, ma it8217s importante sapere quali convenzione il software utilizza quando si sta leggendo l'output. Spesso i parametri sono indicati lì da AR (1), AR (2), 8230, e MA (1), MA (2), 8230 ecc per identificare il modello ARIMA appropriato per Y. si inizia determinando l'ordine di differenziazione (d) che necessita stationarize serie e rimuovere le caratteristiche lordi di stagionalità, forse in combinazione con una trasformazione varianza stabilizzante come registrazione o sgonfiando. Se ci si ferma a questo punto e prevedere che la serie differenziata è costante, si è semplicemente montato un random walk o modello tendenza casuale. Tuttavia, la serie stationarized potrebbe ancora essere autocorrelato errori, il che suggerisce che un numero di termini AR (p 8805 1) Andor alcuni termini numero MA (q 8805 1) sono necessari anche nell'equazione di previsione. Il processo di determinazione dei valori di p, d, e q che sono meglio per una data serie di tempo saranno discussi nelle sezioni successive di note (i cui collegamenti sono nella parte superiore di questa pagina), ma in anteprima alcuni dei tipi di modelli ARIMA non stagionali che vengono comunemente riscontrato è riportata qui sotto. ARIMA modello autoregressivo (1,0,0) del primo ordine: se la serie è fermo e autocorrelato, forse può essere previsto come multiplo del proprio valore precedente, più una costante. L'equazione di previsione in questo caso è 8230which è Y regredito su se stessa ritardato di un periodo. Questo è un modello constant8221 8220ARIMA (1,0,0). Se la media di Y è zero, allora il termine costante non verrebbe inclusa. Se il coefficiente di pendenza 981 1 è positivo e meno di 1 su grandezza (che deve essere inferiore a 1 a grandezza se Y è fermo), il modello descrive significare-ritornando comportamento in cui il valore prossimi period8217s dovrebbe essere previsto per essere 981 1 volte lontano dalla media come questo period8217s valore. Se 981 1 è negativa, predice significare-ritornando comportamento con alternanza di segni, cioè si prevede anche che Y sarà al di sotto del prossimo periodo media se è al di sopra del periodo di dire questo. In un modello autoregressivo del secondo ordine (ARIMA (2,0,0)), ci sarebbe un termine Y t-2 sulla destra pure, e così via. A seconda dei segni e grandezze dei coefficienti, un (2,0,0) modello ARIMA poteva descrivere un sistema il cui reversione medio avviene in modo sinusoidale oscillante, come il moto di una massa su una molla che viene sottoposta a shock casuali . ARIMA (0,1,0) random walk: Se la serie Y non è fermo, il modello più semplice possibile è un modello casuale, che può essere considerato come un caso limite di un AR (1) modello in cui la autoregressivo coefficiente è uguale a 1, cioè una serie con infinitamente lenta reversione media. L'equazione pronostico per questo modello può essere scritto come: dove il termine costante è la variazione media del periodo a periodo (cioè lungo termine deriva) in Y. Questo modello può essere montato come un modello di regressione non intercetta in cui la prima differenza di Y è la variabile dipendente. Dal momento che include (solo) una differenza non stagionale e di un termine costante, è classificato come un quotARIMA (0,1,0) modello con constant. quot Il caso-roulant senza modello - drift sarebbe un ARIMA (0,1, 0) modello senza costante ARIMA (1,1,0) differenziata modello autoregressivo del primo ordine: Se gli errori di un modello random walk sono autocorrelati, forse il problema può essere risolto con l'aggiunta di un ritardo della variabile dipendente alla previsione equation - - cioè regredendo la prima differenza di Y su se stessa ritardato di un periodo. Ciò produrrebbe la seguente equazione previsione: che possono essere riorganizzate a Questo è un modello autoregressivo del primo ordine con un ordine di differenziazione non stagionale e di un termine costante - i. e. un (1,1,0) modello ARIMA. ARIMA (0,1,1) senza costante livellamento esponenziale semplice: Un'altra strategia per correggere gli errori autocorrelati in un modello random walk è suggerita dal semplice modello di livellamento esponenziale. Ricordiamo che per alcune serie di tempo non stazionaria (ad esempio quelle che presentano fluttuazioni rumorosi intorno a una media lentamente variabile), il modello random walk non esegue così come una media mobile di valori passati. In altre parole, invece di prendere l'osservazione più recente come la previsione della successiva osservazione, è preferibile utilizzare una media degli ultimi osservazioni per filtrare il rumore e più accuratamente stimare la media locale. Il semplice modello di livellamento esponenziale utilizza una media mobile esponenziale ponderata dei valori del passato per ottenere questo effetto. L'equazione pronostico per la semplice modello di livellamento esponenziale può essere scritto in un certo numero di forme matematicamente equivalenti. una delle quali è la cosiddetta forma correction8221 8220error, in cui la precedente previsione viene regolata nella direzione dell'errore fece: Perché e t-1 Y t-1 - 374 t-1 per definizione, questo può essere riscritta come : che è un ARIMA (0,1,1) - senza-costante equazione di previsione con 952 1 1 - 945. Ciò significa che è possibile montare un semplice livellamento esponenziale specificando come un modello ARIMA (0,1,1) senza costante, e il MA stimato (1) coefficiente corrisponde a 1-minus-alfa nella formula SES. Ricordiamo che nel modello SES, l'età media dei dati nelle previsioni 1-periodo-ahead è 1 945. senso che essi tenderanno a restare indietro tendenze o punti di svolta da circa 1 945 periodi. Ne consegue che l'età media dei dati nelle previsioni 1-periodo-prima di un ARIMA (0,1,1) - senza-costante modello è 1 (1-952 1). Così, per esempio, se 952 1 0.8, l'età media è 5. Come 952 1 avvicina 1, il ARIMA (0,1,1) - senza-costante modello diventa un media-molto-lungo termine in movimento, e come 952 1 si avvicina a 0 diventa un modello random walk-senza-drift. What8217s il modo migliore per correggere autocorrelazione: aggiunta termini AR o aggiungendo termini MA Nelle precedenti due modelli di cui sopra, il problema degli errori autocorrelati in un modello casuale è stato fissato in due modi diversi: aggiungendo un valore ritardato della serie differenziata l'equazione o l'aggiunta di un valore ritardato del l'errore di previsione. Quale approccio è meglio Una regola empirica per questa situazione, che sarà discusso più dettagliatamente in seguito, è che autocorrelazione positiva di solito è meglio trattata con l'aggiunta di un termine di AR al modello e negativo autocorrelazione di solito è meglio trattata con l'aggiunta di un MA termine. In serie business e tempo economica, autocorrelazione negativa si pone spesso come un artefatto di differenziazione. (In generale, differenziazione riduce autocorrelazione positiva e può anche provocare un interruttore da positivo a negativo autocorrelazione.) Quindi, il modello ARIMA (0,1,1), in cui la differenziazione è accompagnato da un termine MA, è più spesso utilizzato che un ARIMA (1,1,0) del modello. ARIMA (0,1,1) con costante semplice livellamento esponenziale con la crescita: Con l'implementazione del modello SES come un modello ARIMA, è in realtà guadagnare una certa flessibilità. Prima di tutto, il MA stimata (1) coefficiente è permesso di essere negativo. questo corrisponde ad un fattore di livellamento maggiore di 1 in un modello SES, che normalmente non è consentito dalla procedura model-fitting SES. In secondo luogo, si ha la possibilità di includere un termine costante nel modello ARIMA se lo si desidera, al fine di stimare un andamento medio diverso da zero. L'(0,1,1) modello ARIMA con costante ha l'equazione di previsione: Le previsioni di un periodo a venire da questo modello sono qualitativamente simili a quelle del modello SES, tranne che la traiettoria delle previsioni a lungo termine è in genere un pendenza riga (la cui pendenza è uguale a mu) anziché una linea orizzontale. ARIMA (0,2,1) o (0,2,2) senza costante livellamento esponenziale lineare: lineari modelli di livellamento esponenziale sono modelli ARIMA che utilizzano due differenze non stagionali in collegamento con termini MA. La seconda differenza di una serie Y non è semplicemente la differenza tra Y e si ritardato da due periodi, ma piuttosto è la prima differenza della prima --i. e differenza. il cambiamento-in-the-cambiamento di Y al periodo t. Così, la seconda differenza di Y al periodo t è uguale a (Y t - Y t-1) - (Y t-1 - Y t-2) Y t - 2Y t-1 Y t-2. Una seconda differenza di una funzione discreta è analoga ad una derivata seconda di una funzione continua: misura la quotaccelerationquot o quotcurvaturequot in funzione in un dato punto nel tempo. L'(0,2,2) modello ARIMA senza costante prevede che la seconda differenza della serie è uguale a una funzione lineare delle ultime due errori di previsione: che può essere riorganizzato come: dove 952 1 e 952 2 sono il MA (1) e MA (2) coefficienti. Questo è un modello di livellamento esponenziale lineare generale. essenzialmente lo stesso modello di Holt8217s e Brown8217s modello è un caso speciale. Esso utilizza pesato esponenzialmente medie mobili stimare sia a livello locale e una tendenza locale nella serie. Le previsioni a lungo termine di questo modello convergono ad una retta la cui inclinazione dipende dalla tendenza media osservata verso la fine della serie. ARIMA (1,1,2) senza costante smorzata-trend lineare livellamento esponenziale. Questo modello è illustrato nelle slide di accompagnamento sui modelli ARIMA. Si estrapola la tendenza locale alla fine della serie, ma appiattisce fuori a orizzonti previsionali più lunghi per introdurre una nota di cautela, una pratica che ha supporto empirico. Vedi l'articolo sul quotWhy il Damped Trend worksquot da Gardner e McKenzie e l'articolo quotGolden Rulequot da Armstrong et al. per dettagli. In genere è consigliabile attenersi a modelli in cui almeno uno dei p e q non è maggiore di 1, vale a dire non cercare di adattarsi a un modello come ARIMA (2,1,2), in quanto questo rischia di portare a sovradattamento e le questioni che sono discussi in modo più dettagliato nelle note sulla struttura matematica dei modelli ARIMA quotcommon-factorquot. implementazione foglio di calcolo: modelli ARIMA come quelli sopra descritti sono facili da implementare su un foglio di calcolo. L'equazione previsione è semplicemente una equazione lineare che fa riferimento ai valori passati della serie temporale originale e valori passati degli errori. Così, è possibile impostare un foglio di calcolo di previsione ARIMA memorizzando i dati nella colonna A, la formula di previsione nella colonna B, e gli errori (previsioni di dati meno) nella colonna C. La formula di previsione in una cella tipica nella colonna B sarebbe semplicemente un'espressione lineare, con riferimento ai valori precedenti in file di colonne a e C, moltiplicata per i coefficienti adeguati AR o mA memorizzati nelle cellule in altre parti del spreadsheet. Moving media: che cosa è e come calcolarlo guardare il video o leggere l'articolo qui sotto : una media mobile è una tecnica per avere un'idea complessiva delle tendenze in un insieme di dati è una media di qualsiasi sottoinsieme di numeri. La media mobile è estremamente utile per la previsione delle tendenze a lungo termine. È possibile calcolare per qualsiasi periodo di tempo. Ad esempio, se si dispone di dati di vendita per un periodo di venti anni, è possibile calcolare una media mobile di cinque anni, una media mobile di quattro anni, a tre anni di media mobile e così via. analisti del mercato azionario spesso utilizzare una media mobile a 50 o 200 giorni per aiutarli a vedere le tendenze nel mercato azionario e (si spera) del tempo in cui sono diretti gli stock. Una media rappresenta il valore 8220middling8221 di un insieme di numeri. La media mobile è esattamente lo stesso, ma la media è calcolata più volte per diversi sottoinsiemi di dati. Ad esempio, se si desidera una media mobile di due anni per un set di dati da 2000, 2001, 2002 e 2003 si dovrebbe trovare le medie per i sottoinsiemi 20002001, 20.012.002 e 20022003. Le medie mobili di solito sono tracciate e sono più visualizzabili. Calcolo di un 5-Year Moving Problema media Esempio Esempio: Calcolare una media di cinque anni passando dal seguente set di dati: (4M 6M 5M 8M 9M) ​​5 6.4M la media delle vendite per il secondo sottogruppo di cinque anni (2004 8211 2008). centrato attorno al 2006, è 6.6M: (6M 5M 8M 9M 5M) 5 6.6M la media delle vendite per il terzo sottoinsieme di cinque anni (2005 8211 2009). centrato intorno al 2007, è 6.6M: (5M 8M 9M 5M 4M) 5 6.2M continuare a calcolare ogni media di cinque anni, fino a raggiungere la fine del set (2009-2013). Questo vi dà una serie di punti (medie) che è possibile utilizzare per tracciare un grafico delle medie mobili. La seguente tabella Excel mostra le medie mobili calcolate per 2003-2012 insieme ad un grafico a dispersione dei dati: guarda il video o leggere i passi di seguito: Excel ha un potente add-in, dei dati Strumenti di analisi (come caricare i dati Strumenti di analisi) che offre molte opzioni extra, tra cui una funzione di media mobile automatizzato. La funzione non solo calcola la media mobile per te, rappresenta graficamente anche dati originali contemporaneamente. risparmiando un bel po 'di tasti. Excel 2013: passi Passo 1: Fare clic sulla scheda 8220Data8221 e quindi fare clic su 8220Data Analysis.8221 Passo 2: Cliccare 8220Moving average8221 e quindi fare clic su 8220OK.8221 Fase 3: Fare clic sulla casella 8220Input Range8221 e quindi selezionare i dati. Se si includono intestazioni di colonna, assicurati di controllare le etichette in scatola prima fila. Fase 4: Inserire un intervallo nella casella. Un intervallo è quanti punti precedenti si desidera Excel da utilizzare per il calcolo della media mobile. Ad esempio, 822058221 avrebbe utilizzato i precedenti 5 punti dati per calcolare la media per ogni punto successivo. Più basso è l'intervallo, la media più vicino il vostro movimento è al vostro set di dati originali. Fase 5: Fare clic nella casella 8220Output Range8221 e selezionare un'area del foglio di lavoro in cui si desidera visualizzare il risultato. In alternativa, fare clic sul pulsante di opzione worksheet8221 8220New. Passo 6: Selezionare la casella 8220Chart Output8221 se si desidera visualizzare un grafico dei dati set (se si dimentica di fare questo, si può sempre tornare indietro e aggiungerlo o scegliere un grafico dal 8220Insert8221 tab.8221 Punto 7: Premete 8220OK 0,8221 Excel restituirà i risultati nella zona specificata al punto 6. Guarda il video, o leggere i passi di seguito: Esempio problema: calcolare la media mobile di tre anni in Excel per i seguenti dati di vendita: 2003 (33M) 2004 (22M), 2005 (36M), 2006 (34M), 2007 (43M), 2008 (39M), 2009 (41M), 2010 (36M), 2011 (45M), 2012 (56M), il 2013 (64M). Passo 1: Inserire i dati in due colonne in Excel la prima colonna dovrebbe avere l'anno e la seconda colonna i dati quantitativi (in questo esempio problema, i dati di vendita) Verificare che non vi siano righe vuote nei dati celle Fase 2... : Calcolare il primo media triennale (2003-2005) per i dati per questo problema di esempio, tipo 8220 (B2B3B4) 38221 in D3 cella calcolo del primo media Passo 3:... Trascinare il quadrato nell'angolo in basso a destra verso il basso per spostare la formula a tutte le celle della colonna. Questo calcola le medie per gli anni successivi (ad esempio 2004-2006, 2005-2007). Trascinando la formula. Fase 4: (Facoltativo) Creare un grafico. Selezionare tutti i dati nel foglio di lavoro. Fare clic sulla scheda 8220Insert8221, quindi fare clic su 8220Scatter, 8221 quindi su 8220Scatter con linee morbide e markers.8221 Un grafico della vostra media mobile apparirà sul foglio di lavoro. Controlla il nostro canale YouTube per ulteriori statistiche aiutano e suggerimenti Moving Average: Che cosa è e come calcolare è stato modificato l'ultima volta: 8 gennaio 2016 da Andale 22 pensieri su ldquo Moving Average: Che cosa è e come calcolarlo rdquo Questo è perfetta e semplice da assimilare. Grazie per il lavoro Questo è molto chiaro e informativo. Domanda: Come si fa a calcolare un 4 anni media mobile che anno sarebbe il movimento centrale media di 4 anni sulla Sarebbe centrare la fine del secondo anno (cioè 31 dicembre). Posso usare reddito medio per prevedere i guadagni futuri qualcuno sa media circa centrato Vi preghiamo gentilmente dirmi se qualcuno sa. Qui it8217s visto che dobbiamo prendere in considerazione 5 anni per ottenere la media che è in center. Then per quanto riguarda gli anni di riposo, se vogliamo ottenere la media di 20118230as abbiamo don8217t avere ulteriori valori dopo il 2012, quindi come potremmo calcolare come si don8217t ha più informazioni, sarebbe impossibile calcolare il mA 5 anni per il 2011. si potrebbe ottenere due anni di media mobile però. Ciao, Grazie per il video. Tuttavia, una cosa è chiara. Come fare una previsione per i prossimi mesi mostra il video di previsioni per i mesi per i quali i dati sono già disponibili. Ciao, Crudo, I8217m lavorando per ampliare l'articolo per includere la previsione. Il processo è un po 'più complicato rispetto all'utilizzo di dati passati però. Date un'occhiata a questo articolo Duke University, che spiega in modo approfondito. Saluti, Stephanie grazie per un explanantion chiaro. Ciao Impossibile trovare il link per l'articolo Duke University suggerito. Richiesta per pubblicare il link againMoving modelli medi e esponenziale Come primo passo per andare oltre i modelli medi, modelli random walk, e modelli di tendenza lineare, i modelli non stagionali e le tendenze possono essere estrapolati utilizzando un modello a media mobile o levigante. L'assunto di base dietro media e modelli di livellamento è che la serie temporale è localmente stazionario con una media lentamente variabile. Quindi, prendiamo una media mobile (locale) per stimare il valore corrente della media e poi utilizzarla come la previsione per il prossimo futuro. Questo può essere considerato come un compromesso tra il modello media e la deriva modello random walk-senza-. La stessa strategia può essere utilizzata per stimare e estrapolare una tendenza locale. Una media mobile è spesso chiamato una versione quotsmoothedquot della serie originale, perché la media a breve termine ha l'effetto di appianare i dossi nella serie originale. Regolando il grado di lisciatura (la larghezza della media mobile), possiamo sperare di colpire un qualche tipo di equilibrio ottimale tra le prestazioni dei modelli medi e random walk. Il tipo più semplice di modello di media è il. Semplice (equamente ponderate) Media mobile: Le previsioni per il valore di Y al tempo t1 che viene fatta al tempo t è pari alla media semplice dei più recenti osservazioni m: (Qui e altrove mi utilizzerà il simbolo 8220Y-hat8221 di stare per una previsione di serie temporali Y fatta quanto prima prima possibile da un dato modello.) Questa media è centrato periodo t - (m1) 2, il che implica che la stima della media locale tenderà a restare indietro il vero valore della media locale circa (m1) 2 periodi. Così, diciamo l'età media dei dati nella media mobile semplice (m1) 2 rispetto al periodo per il quale è calcolata la previsione: questa è la quantità di tempo per cui previsioni tenderanno a restare indietro ruotando punti nei dati . Ad esempio, se si sta una media degli ultimi 5 valori, le previsioni saranno circa 3 periodi in ritardo nel rispondere a punti di svolta. Si noti che se m1, il modello di media mobile semplice (SMA) è equivalente al modello random walk (senza crescita). Se m è molto grande (paragonabile alla lunghezza del periodo di stima), il modello SMA è equivalente al modello medio. Come con qualsiasi parametro di un modello di previsione, è consuetudine per regolare il valore di k per ottenere la migliore quotfitquot ai dati, cioè i più piccoli errori di previsione in media. Ecco un esempio di una serie che sembra mostrare fluttuazioni casuali intorno a una media lentamente variabile. Innanzitutto, proviamo per adattarsi con un modello casuale, che è equivalente a una media mobile semplice di 1 termine: Il modello random walk risponde molto velocemente alle variazioni della serie, ma così facendo raccoglie gran parte del quotnoisequot nel dati (le fluttuazioni casuali) e il quotsignalquot (media locale). Se invece cerchiamo una semplice media mobile di 5 termini, si ottiene un insieme più agevole dall'aspetto delle previsioni: Il 5-termine mobile semplice rese medie in modo significativo gli errori più piccoli rispetto al modello random walk in questo caso. L'età media dei dati di questa previsione è 3 ((51) 2), in modo che tende a ritardo punti di svolta da circa tre periodi. (Per esempio, una flessione sembra essersi verificato in periodo di 21, ma le previsioni non girare intorno fino a diversi periodi più tardi.) Si noti che le previsioni a lungo termine dal modello SMA sono una retta orizzontale, proprio come nel random walk modello. Pertanto, il modello SMA presuppone che vi sia alcuna tendenza nei dati. Tuttavia, mentre le previsioni del modello random walk sono semplicemente uguale all'ultimo valore osservato, le previsioni del modello di SMA sono pari ad una media ponderata dei valori ultimi. I limiti di confidenza calcolato dai Statgraphics per le previsioni a lungo termine della media mobile semplice non ottengono più ampio con l'aumento della previsione all'orizzonte. Questo ovviamente non è corretto Purtroppo, non vi è alcuna teoria statistica di fondo che ci dice come gli intervalli di confidenza deve ampliare per questo modello. Tuttavia, non è troppo difficile da calcolare le stime empiriche dei limiti di confidenza per le previsioni di più lungo orizzonte. Ad esempio, è possibile impostare un foglio di calcolo in cui il modello SMA sarebbe stato utilizzato per prevedere 2 passi avanti, 3 passi avanti, ecc all'interno del campione di dati storici. È quindi possibile calcolare le deviazioni standard campione degli errori in ogni orizzonte di previsione, e quindi la costruzione di intervalli di confidenza per le previsioni a lungo termine aggiungendo e sottraendo multipli della deviazione standard appropriato. Se cerchiamo una media del 9 termine semplice movimento, otteniamo le previsioni ancora più fluide e più di un effetto ritardo: L'età media è ora 5 punti ((91) 2). Se prendiamo una media mobile 19-termine, l'età media aumenta a 10: Si noti che, in effetti, le previsioni sono ora in ritardo punti di svolta da circa 10 periodi. Quale quantità di smoothing è meglio per questa serie Ecco una tabella che mette a confronto le loro statistiche di errore, anche compreso in media 3-termine: Modello C, la media mobile a 5-termine, i rendimenti il ​​valore più basso di RMSE da un piccolo margine su 3 - term e 9 termine medie, e le loro altre statistiche sono quasi identici. Così, tra i modelli con le statistiche di errore molto simili, possiamo scegliere se avremmo preferito un po 'più di risposta o un po' più scorrevolezza nelle previsioni. (Torna a inizio pagina.) Browns semplice esponenziale (media mobile esponenziale ponderata) Il modello a media mobile semplice di cui sopra ha la proprietà indesiderabile che tratta le ultime osservazioni k ugualmente e completamente ignora tutte le osservazioni che precedono. Intuitivamente, dati passati devono essere attualizzati in modo più graduale - per esempio, il più recente osservazione dovrebbe avere un peso poco più di 2 più recente, e la 2 più recente dovrebbe ottenere un po 'più peso che la 3 più recente, e presto. Il modello semplice di livellamento esponenziale (SES) realizza questo. Diamo 945 denotano una constantquot quotsmoothing (un numero compreso tra 0 e 1). Un modo per scrivere il modello è quello di definire una serie L che rappresenta il livello attuale (cioè il valore medio locale) della serie come stimato dai dati fino ad oggi. Il valore di L al momento t è calcolata in modo ricorsivo dal proprio valore precedente in questo modo: Così, il valore livellato corrente è una interpolazione tra il valore livellato precedente e l'osservazione corrente, dove 945 controlla la vicinanza del valore interpolato al più recente osservazione. Le previsioni per il prossimo periodo è semplicemente il valore livellato corrente: Equivalentemente, possiamo esprimere la prossima previsione direttamente in termini di precedenti previsioni e osservazioni precedenti, in una delle seguenti versioni equivalenti. Nella prima versione, la previsione è una interpolazione tra precedente meteorologiche e precedente osservazione: Nella seconda versione, la prossima previsione è ottenuta regolando la previsione precedente nella direzione dell'errore precedente di una quantità frazionaria 945. è l'errore al tempo t. Nella terza versione, la previsione è di un (cioè scontato) media mobile esponenziale ponderata con fattore di sconto 1- 945: La versione di interpolazione della formula di previsione è il più semplice da usare se si implementa il modello su un foglio di calcolo: si inserisce in un singola cellula e contiene i riferimenti di cella che puntano alla previsione precedente, l'osservazione precedente, e la cella in cui è memorizzato il valore di 945. Si noti che se 945 1, il modello SES è equivalente ad un modello random walk (senza crescita). Se 945 0, il modello SES è equivalente al modello medio, assumendo che il primo valore livellato è impostata uguale alla media. (Torna a inizio pagina). L'età media dei dati nelle previsioni semplice esponenziale-levigante è di 1 945 relativo al periodo per il quale è calcolata la previsione. (Questo non dovrebbe essere ovvio, ma può essere facilmente dimostrare valutando una serie infinita.) Quindi, la semplice previsione media mobile tende a restare indietro punti di svolta da circa 1 945 periodi. Ad esempio, quando 945 0.5 il ritardo è di 2 periodi in cui 945 0.2 il ritardo è di 5 periodi in cui 945 0.1 il ritardo è di 10 periodi, e così via. Per una data età media (cioè quantità di ritardo), il semplice livellamento esponenziale (SES) previsione è un po 'superiore alla previsione media mobile semplice (SMA) perché pone relativamente più peso sulla più recente --i. e osservazione. è leggermente più quotresponsivequot ai cambiamenti che si verificano nel recente passato. Per esempio, un modello di SMA con 9 termini e un modello di SES con 945 0,2 entrambi hanno un'età media di 5 per i dati nelle loro previsioni, ma il modello SES mette più peso sugli ultimi 3 valori di quanto non faccia il modello SMA e al contempo doesn8217t interamente 8220forget8221 sui valori più di 9 periodi vecchi, come mostrato in questo grafico: un altro importante vantaggio del modello SES sul modello SMA è che il modello SES utilizza un parametro smoothing che è continuamente variabile, in modo che possa facilmente ottimizzato utilizzando un algoritmo quotsolverquot per minimizzare l'errore quadratico medio. Il valore ottimale di 945 nel modello SES a questa serie risulta essere 0,2961, come illustrato di seguito: L'età media dei dati in questa previsione è 10.2961 3.4 periodi, che è simile a quella di una media 6 termine mobile semplice. Le previsioni a lungo termine dal modello SES sono una linea retta orizzontale. come nel modello SMA e il modello random walk senza crescita. Si noti tuttavia che gli intervalli di confidenza calcolati da Statgraphics ora divergono in modo ragionevole dall'aspetto, e che sono sostanzialmente più stretto gli intervalli di confidenza per il modello random walk. Il modello di SES presuppone che la serie è un po 'predictablequot quotmore di quanto non faccia il modello random walk. Un modello SES è in realtà un caso particolare di un modello ARIMA. così la teoria statistica dei modelli ARIMA fornisce una solida base per il calcolo intervalli di confidenza per il modello SES. In particolare, un modello SES è un modello ARIMA con una differenza nonseasonal, un MA (1) termine, e nessun termine costante. altrimenti noto come un modello quotARIMA (0,1,1) senza constantquot. Il MA (1) coefficiente nel modello ARIMA corrisponde alla quantità 1- 945 nel modello SES. Ad esempio, se si adatta un modello ARIMA (0,1,1) senza costante alla serie analizzate qui, il MA stimato (1) coefficiente risulta essere 0,7029, che è quasi esattamente un meno 0,2961. È possibile aggiungere l'assunzione di una tendenza non-zero costante lineare per un modello SES. Per fare questo, basta specificare un modello ARIMA con una differenza non stagionale e di un (1) termine MA con una costante, cioè un (0,1,1) modello ARIMA con costante. Le previsioni a lungo termine avranno quindi una tendenza che è uguale alla tendenza medio rilevato nel corso dell'intero periodo di stima. Non si può fare questo in collaborazione con destagionalizzazione, perché le opzioni di destagionalizzazione sono disattivati ​​quando il tipo di modello è impostato su ARIMA. Tuttavia, è possibile aggiungere una costante a lungo termine tendenza esponenziale ad un semplice modello di livellamento esponenziale (con o senza regolazione stagionale) utilizzando l'opzione di regolazione inflazione nella procedura di previsione. Il tasso appropriato quotinflationquot (crescita percentuale) per periodo può essere stimato come il coefficiente di pendenza in un modello trend lineare montato i dati in combinazione con una trasformazione logaritmo naturale, oppure può essere basata su altri, informazione indipendente per quanto riguarda le prospettive di crescita a lungo termine . (Ritorna all'inizio pagina.) Browns lineari (cioè doppie) modelli esponenziale La SMA e modelli di SES per scontato che non vi è alcuna tendenza di alcun tipo nei dati (che di solito è OK, o almeno non troppo male per 1- previsioni passo avanti quando i dati sono relativamente rumoroso), e possono essere modificati per includere un trend lineare costante come indicato sopra. Che dire di tendenze a breve termine Se una serie mostra un tasso variabile di crescita o un andamento ciclico che si distingue chiaramente contro il rumore, e se vi è la necessità di prevedere più di 1 periodo a venire, allora la stima di una tendenza locale potrebbe anche essere un problema. Il semplice modello di livellamento esponenziale può essere generalizzata per ottenere un modello lineare di livellamento esponenziale (LES) che calcola le stime locali sia a livello e di tendenza. Il modello di tendenza tempo-variante più semplice è Browns lineare modello di livellamento esponenziale, che utilizza due diverse serie levigato che sono centrate in diversi punti nel tempo. La formula di previsione si basa su un'estrapolazione di una linea attraverso i due centri. (Una versione più sofisticata di questo modello, Holt8217s, è discusso qui di seguito.) La forma algebrica di Brown8217s lineare modello di livellamento esponenziale, come quello del semplice modello di livellamento esponenziale, può essere espresso in una serie di forme diverse ma equivalenti. La forma quotstandardquot di questo modello è di solito espressa come segue: Sia S denotano la serie singolarmente-levigata ottenuta applicando semplice livellamento esponenziale di serie Y. Cioè, il valore di S al periodo t è dato da: (Ricordiamo che, in semplice livellamento esponenziale, questo sarebbe il tempo per Y al periodo t1) Allora che Squot denotano la serie doppiamente levigata ottenuta applicando semplice livellamento esponenziale (utilizzando lo stesso 945) per serie S:. Infine, le previsioni per Y tk. per qualsiasi kgt1, è data da: Questo produce e 1 0 (vale a dire imbrogliare un po ', e lasciare che la prima previsione uguale l'attuale prima osservazione), ed e 2 Y 2 8211 Y 1. dopo di che le previsioni sono generati usando l'equazione di cui sopra. Questo produce gli stessi valori stimati come la formula basata su S e S se questi ultimi sono stati avviati utilizzando S 1 S 1 Y 1. Questa versione del modello è usato nella pagina successiva che illustra una combinazione di livellamento esponenziale con regolazione stagionale. modello Holt8217s lineare esponenziale Brown8217s LES calcola stime locali di livello e l'andamento lisciando i dati recenti, ma il fatto che lo fa con un singolo parametro smoothing pone un vincolo sui modelli di dati che è in grado di adattarsi: il livello e tendenza non sono autorizzati a variare a tassi indipendenti. modello Holt8217s LES risolve questo problema includendo due costanti di lisciatura, uno per il livello e uno per la tendenza. In ogni momento t, come nel modello Brown8217s, il c'è una stima L t del livello locale e una T t stima della tendenza locale. Qui vengono calcolati ricorsivamente dal valore di Y osservata al tempo t e le stime precedenti del livello e l'andamento di due equazioni che si applicano livellamento esponenziale separatamente. Se il livello stimato e tendenza al tempo t-1 sono L t82091 e T t-1. rispettivamente, la previsione per Y tshy che sarebbe stato fatto al tempo t-1 è uguale a L t-1 T t-1. Quando si osserva il valore effettivo, la stima aggiornata del livello è calcolata in modo ricorsivo interpolando tra Y tshy e le sue previsioni, L t-1 T t-1, con pesi di 945 e 945. 1- La variazione del livello stimato, vale a dire L t 8209 L t82091. può essere interpretato come una misura rumorosa della tendenza al tempo t. La stima aggiornata del trend viene poi calcolata in modo ricorsivo interpolando tra L t 8209 L t82091 e la stima precedente del trend, T t-1. utilizzando pesi di 946 e 1-946: L'interpretazione del trend-smoothing costante 946 è analoga a quella del livello-levigatura costante 945. Modelli con piccoli valori di 946 assume che la tendenza cambia solo molto lentamente nel tempo, mentre i modelli con grande 946 supporre che sta cambiando più rapidamente. Un modello con un grande 946 ritiene che il lontano futuro è molto incerto, perché gli errori in trend-stima diventano molto importanti quando la previsione più di un periodo avanti. (Torna a inizio pagina.) Il livellamento costanti di 945 e 946 può essere stimato nel modo consueto minimizzando la media errore delle previsioni 1-step-ahead quadrato. Quando questo fatto in Statgraphics, le stime risultano essere 945 0,3048 e 946 0.008. Il valore molto piccolo di 946 significa che il modello assume molto poco cambiamento di tendenza da un periodo all'altro, in modo sostanzialmente questo modello sta cercando di stimare un trend di lungo periodo. Per analogia con la nozione di età media dei dati utilizzati nella stima del livello locale della serie, l'età media dei dati che viene utilizzato per stimare la tendenza locale è proporzionale a 1 946, anche se non esattamente uguale ad esso . In questo caso risulta essere 10,006 125. Questo isn8217t un numero molto preciso in quanto la precisione della stima di 946 isn8217t realmente 3 decimali, ma è dello stesso ordine generale di grandezza della dimensione del campione di 100, così questo modello è una media di più di un bel po 'di storia nella stima del trend. La trama meteo seguente mostra che il modello LES stima un leggermente maggiore tendenza locale alla fine della serie rispetto alla tendenza costante stimata nel modello SEStrend. Inoltre, il valore stimato di 945 è quasi identica a quella ottenuta inserendo il modello SES con o senza tendenza, quindi questo è quasi lo stesso modello. Ora, queste sembrano le previsioni ragionevoli per un modello che dovrebbe essere stimare un trend locale Se si 8220eyeball8221 questa trama, sembra che la tendenza locale si è trasformato in basso alla fine della serie Quello che è successo I parametri di questo modello sono stati stimati minimizzando l'errore quadratico delle previsioni 1-step-ahead, non le previsioni a lungo termine, nel qual caso la tendenza doesn8217t fare un sacco di differenza. Se tutti si sta guardando sono errori 1-step-avanti, non si è visto il quadro più ampio delle tendenze sopra (diciamo) 10 o 20 periodi. Al fine di ottenere questo modello più in sintonia con la nostra bulbo oculare estrapolazione dei dati, siamo in grado di regolare manualmente la tendenza-smoothing costante in modo che utilizzi una base più breve per la stima di tendenza. Ad esempio, se si sceglie di impostare 946 0.1, quindi l'età media dei dati utilizzati nella stima la tendenza locale è di 10 periodi, il che significa che ci sono in media il trend negli ultimi 20 periodi che o giù di lì. Here8217s quello che la trama del tempo si presenta come se impostiamo 946 0.1, mantenendo 945 0.3. Questo sembra intuitivamente ragionevole a questa serie, anche se probabilmente è pericoloso estrapolare questa tendenza eventuali più di 10 periodi in futuro. Che dire le statistiche di errore Ecco un confronto modello per i due modelli sopra indicati, nonché tre modelli SES. Il valore ottimale di 945.per modello SES è di circa 0,3, ma risultati simili (con leggermente più o meno reattività, rispettivamente) sono ottenute con 0,5 e 0,2. exp lineare (A) Holts. levigatura con alfa e beta 0,3048 0.008 (B) Holts exp lineare. levigatura con alpha 0.3 e beta 0.1 (C) livellamento esponenziale semplice con alfa 0,5 (D) livellamento esponenziale semplice con alpha 0.3 (E) livellamento esponenziale semplice con alpha 0.2 Le loro statistiche sono quasi identiche, quindi abbiamo davvero can8217t fare la scelta sulla base di errori di previsione 1-step-avanti all'interno del campione di dati. Dobbiamo ripiegare su altre considerazioni. Se crediamo fermamente che ha senso basare la stima attuale tendenza su quanto è successo negli ultimi 20 periodi o giù di lì, siamo in grado di fare un caso per il modello LES con 945 0,3 e 946 0.1. Se vogliamo essere agnostici sul fatto che vi è una tendenza locale, poi uno dei modelli SES potrebbe essere più facile da spiegare e darebbe anche altre previsioni middle-of-the-road per i prossimi 5 o 10 periodi. (Ritorna all'inizio pagina.) Quale tipo di trend-estrapolazione è meglio: L'evidenza empirica orizzontale o lineare suggerisce che, se sono già stati adeguati i dati (se necessario) per l'inflazione, allora può essere imprudente per estrapolare lineare a breve termine tendenze molto lontano nel futuro. Le tendenze evidenti oggi possono rallentare in futuro, dovuta a cause diverse quali obsolescenza dei prodotti, l'aumento della concorrenza, e flessioni cicliche o periodi di ripresa in un settore. Per questo motivo, semplice livellamento esponenziale spesso si comporta meglio out-of-sample che altrimenti potrebbero essere previsto, nonostante la sua quotnaivequot estrapolazione di tendenza orizzontale. modifiche di tendenza smorzato del modello di livellamento esponenziale lineare sono spesso utilizzati in pratica per introdurre una nota di conservatorismo nelle sue proiezioni di tendenza. Il modello LES smorzata-tendenza può essere implementato come un caso particolare di un modello ARIMA, in particolare, un modello (1,1,2) ARIMA. E 'possibile calcolare gli intervalli di confidenza intorno previsioni a lungo termine prodotte da modelli di livellamento esponenziale, considerandoli come casi speciali di modelli ARIMA. (Attenzione: non tutto il software calcola correttamente intervalli di confidenza per questi modelli.) La larghezza degli intervalli di confidenza dipende (i) l'errore RMS del modello, (ii) il tipo di levigatura (semplice o lineare) (iii) il valore (s) della costante di smoothing (s) e (iv) il numero di periodi avanti si prevedono. In generale, gli intervalli distribuite più veloce come 945 diventa più grande nel modello SES e si propagano molto più velocemente quando lineare piuttosto che semplice lisciatura viene utilizzato. Questo argomento è discusso ulteriormente nella sezione modelli ARIMA delle note. (Torna all'inizio della pagina.)

No comments:

Post a Comment