Wednesday 6 September 2017

Autoregressive Mobile Media Simulazione


Autoregressive Moving Average ARMA (p, q) I modelli per Time Series Analysis - Parte 3 Questo è il terzo e ultimo posto nella miniserie su Autoregressive modello a media mobile (ARMA) per l'analisi di serie temporali. Weve ha introdotto modelli autoregressivi e modello a media mobile nei due articoli precedenti. Ora è il momento di combinare in modo da produrre un modello più sofisticato. In definitiva questo ci porterà ai modelli ARIMA e GARCH che ci permetteranno di prevedere rendimenti delle attività e della volatilità del tempo. Questi modelli costituiranno la base per i segnali di trading e le tecniche di gestione del rischio. Se avete letto parte 1 e parte 2 avrete visto che si tende a seguire un modello per la nostra analisi di un modello di serie storica. Ill ripetere brevemente qui: Razionale - Perché siamo interessati a questo particolare modello Definizione - Una definizione matematica per ridurre ambiguità. Correlogramma - Tracciare un correlogramma di esempio per visualizzare un comportamento modelli. Simulazione e montaggio - Montaggio del modello per simulazioni, al fine di garantire weve capito correttamente il modello. Reale dei dati finanziari - Applicare il modello di prezzi delle attività reali storici. Previsione - Previsione valori successivi per costruire segnali di trading o filtri. Al fine di seguire questo articolo si consiglia di dare un'occhiata a gli articoli precedenti su analisi di serie temporali. Essi possono essere trovati qui. Informazioni Bayesiano criterio Nella parte 1 di questa serie di articoli abbiamo esaminato il criterio di informazione di Akaike (AIC) come un mezzo per aiutare a scegliere tra i migliori modelli di serie tempo separati. Uno strumento strettamente correlato è il criterio di informazione bayesiana (BIC). In sostanza si ha un comportamento simile a quello AIC in quanto penalizza modelli per avere troppi parametri. Questo può portare a overfitting. La differenza tra il BIC e AIC è che il BIC più rigoroso con la penalizzazione di parametri aggiuntivi. Informazioni bayesiano Criterion Se prendiamo la funzione di verosimiglianza per un modello statistico, che ha i parametri k, e L massimizza la probabilità. allora il criterio di informazione bayesiana è dato da: dove n è il numero di punti di dati in serie temporale. Useremo l'AIC e BIC di seguito nella scelta di modelli appropriati ARMA (p, q). Ljung-Box di prova Nella parte 1 di questa serie di articoli Rajan menzionato nel Disqus commenta che il test di Ljung-Box è stato più appropriato utilizzare il Akaike criterio di informazione del criterio di informazione bayesiana nel decidere se un modello ARMA era una buona misura per un tempo serie. Il test di Ljung-Box è un test di ipotesi classica che è stato progettato per verificare se un insieme di autocorrelazioni di un modello di serie storica montato differiscono in modo significativo da zero. Il test non verifica ogni singolo lag per casualità, bensì verifica la casualità su un gruppo di ritardi. Ljung-Box di prova Definiamo l'ipotesi nulla come: Il tempo di dati di serie ad ogni ritardo sono i. i.d .. cioè, le correlazioni tra i valori della serie popolazione sono pari a zero. Definiamo l'ipotesi alternativa come: il tempo di dati di serie non sono i. i.d. e in possesso di correlazione seriale. Calcoliamo la seguente statistica test. D: Dove n è la lunghezza del campione serie temporale, cappello k è l'autocorrelazione campione a lag k ed h è il numero di ritardi sotto test. La regola di decisione sul fatto di rifiutare l'ipotesi nulla è quello di verificare se Q GT Chi2, per una distribuzione chi-quadrato con h gradi di libertà al 100 (1-alfa) percentile esimo. Mentre i dettagli del test possono sembrare leggermente complesso, possiamo infatti utilizzare R per calcolare il test per noi, semplificando la procedura alquanto. Autogressive media mobile (ARMA) Tutti i modelli di ordine p, q Ora che weve discusso il BIC e il test Ljung-Box, erano pronti a discutere il nostro primo modello misto, vale a dire il Autoregressive media mobile di ordine p, q, o ARMA (p, q). Fino ad oggi abbiamo considerato i processi autoregressivi e lo spostamento dei processi medi. Il primo modello considera il proprio comportamento passato come input per il modello e come tale tentativi di catturare gli effetti operatore, come la quantità di moto e di ritorno alla media nella compravendita di azioni. Quest'ultimo modello è utilizzato per caratterizzare le informazioni shock per una serie, come ad esempio un annuncio a sorpresa guadagni o eventi imprevisti (come la fuoriuscita di petrolio BP Deepwater Horizon). Quindi, un modello ARMA tenta di catturare entrambi questi aspetti quando si modellano serie finanziarie. Si noti che un modello ARMA non prende in considerazione la volatilità di clustering, una chiave fenomeni empirici di molte serie storiche finanziarie. E non è un modello condizionale heteroscedastic. Per questo avremo bisogno di aspettare per i modelli ARCH e GARCH. Definizione Il modello ARMA (p, q) è una combinazione lineare di due modelli lineari e, quindi, è di per sé ancora lineare: modello autoregressivo a media mobile di ordine p, q Un modello di serie storica, è un modello autoregressivo a media mobile di ordine p, q . ARMA (p, q), se: iniziare xt alfa1 x alfa2 x ldots peso beta1 w beta2 w ldots betaq w end in cui è rumore bianco con E (in peso) 0 e varianza sigma2. Se consideriamo l'operatore spostamento all'indietro. (Vedi un articolo precedente) allora possiamo riscrivere quanto sopra come un theta funzioni e phi di: Possiamo semplicemente vedere che impostando p neq 0 e Q0 recuperiamo il modello AR (p). Allo stesso modo se abbiamo impostato p 0 e q neq 0 recuperiamo il modello MA (q). Una delle caratteristiche chiave del modello ARMA è che è parsimoniosa e esubero dei parametri. Cioè, un modello ARMA spesso richiede meno parametri di un AR (p) o modello MA (q) da solo. Inoltre se riscriviamo l'equazione in termini di BSO, allora il theta e phi polinomi volte possono condividere un fattore comune, portando così ad un modello più semplice. Simulazioni e correlogrammi Come con la autoregressivo e modello a media mobile ci sarà ora simulare varie serie ARMA e quindi tentare di adattare modelli ARMA a queste realizzazioni. Portiamo questo perché vogliamo essere certi che abbiamo capito la procedura di montaggio, compreso il modo di calcolare gli intervalli di confidenza per i modelli, così come garantire che la procedura viene effettivamente recuperare stime ragionevoli per i parametri originali ARMA. Nella Parte 1 e Parte 2 abbiamo costruito manualmente l'AR e serie MA attingendo N campioni da una distribuzione normale e quindi la lavorazione del modello di serie storica specifico utilizzando ritardi di questi campioni. Tuttavia, c'è un modo più semplice per simulare AR, MA, ARMA e anche dati ARIMA, semplicemente utilizzando il metodo arima. sim in R. Iniziamo con il modello più semplice possibile non banale ARMA, cioè la ARMA (1,1 ) modello. Cioè, un modello autoregressivo di ordine uno combinato con un modello media mobile di ordine uno. Tale modello ha solo due coefficienti, alfa e beta, che rappresentano i primi ritardi del tempo serie stessa e le condizioni rumore bianco d'urto. Tale modello è data da: Abbiamo bisogno di specificare i coefficienti prima simulazione. Consente di prendere alfa e beta 0.5 -0.5: L'uscita è la seguente: Lascia anche tracciare la correlogramma: Possiamo vedere che non vi è alcuna autocorrelazione significativo, che ci si può aspettare da un modello ARMA (1,1). Infine, permette di cercare di determinare i coefficienti ed i loro errori standard utilizzando la funzione di Arima: Possiamo calcolare gli intervalli di confidenza per ogni parametro utilizzando gli errori standard: Gli intervalli di confidenza contengono i valori dei parametri veri per entrambi i casi, però dobbiamo notare che il 95 intervalli di confidenza sono molto ampia (conseguenza delle ragionevolmente grandi errori standard). Consente ora provare un modello ARMA (2,2). Cioè, una (2) Modello AR combinato con un (2) Modello MA. Abbiamo bisogno di specificare quattro parametri per questo modello: alfa1, alfa2, beta1 e beta2. Consente di prendere alfa1 0.5, beta10.5 alpha2-0.25 e beta2-0.3: L'uscita del nostro modello ARMA (2,2) è la seguente: e il corrispondente autocorelation: Ora possiamo provare il montaggio di un modello ARMA (2,2) per i dati: possiamo anche calcolare gli intervalli di confidenza per ogni parametro: Si noti che gli intervalli di confidenza per i coefficienti per la componente media mobile (beta1 e beta2) in realtà non contengono il valore del parametro originale. Questo delinea il pericolo di tentare di adattare i modelli di dati, anche quando sappiamo che i valori dei parametri veri Tuttavia, a scopo di negoziazione abbiamo solo bisogno di avere un potere predittivo che supera il caso e produce abbastanza profitto al di sopra dei costi di transazione, al fine di essere redditizia in lungo periodo. Ora che weve visto alcuni esempi di modelli ARMA simulati abbiamo bisogno meccanismo per la scelta dei valori di p e q quando il montaggio di modelli di dati finanziari reali. La scelta del modello più ARMA (p, q) Al fine di determinare quale ordine p, q del modello ARMA è appropriato per una serie, abbiamo bisogno di usare l'AIC (o BIC) attraverso un sottoinsieme di valori per p, q, e quindi applicare il test Ljung-Box per determinare se una buona misura è stato raggiunto, per particolari valori di p, q. Per mostrare questo metodo che stiamo per simulare in primo luogo un particolare processo ARMA (p, q). Ci sarà poi un ciclo su tutti i valori di coppie di p e q in e calcolare l'AIC. Noi selezionare il modello con l'AIC più basso e quindi eseguire un test di Ljung-Box sui residui per determinare se abbiamo raggiunto una buona forma. Iniziamo simulando un (3,2) Serie ARMA: Noi ora creare un finale oggetto per memorizzare la misura migliore modello e il più basso valore di AIC. Abbiamo ciclica delle p varie combinazioni, Q e utilizzate l'oggetto corrente per memorizzare la forma di un modello ARMA (i, j), per le variabili di loop iej. Se la corrente AIC è inferiore a qualsiasi AIC precedentemente calcolato abbiamo impostato la finale AIC a questo valore corrente e selezionare questo ordine. Al termine del ciclo abbiamo l'ordine del modello ARMA memorizzato nella final. order e ARIMA (p, d, q) si adatta (con il componente d integrato impostato su 0) memorizzati come final. arma: Consente l'uscita AIC , l'ordine e la coefficienti ARIMA: possiamo vedere che l'ordine originale del modello ARMA simulato è stato recuperato, vale a dire con la P3 e q2. Siamo in grado di tracciare la corelogram dei residui del modello per vedere se si guardano come una realizzazione di discreta rumore bianco (DWN): Il corelogram effettivamente apparire come una realizzazione di DWN. Infine, eseguiamo il test Ljung-Box per 20 in ritardo per confermare questo: Si noti che il p-valore è maggiore di 0,05, in cui si afferma che i residui siano indipendenti a livello 95 e quindi un (3,2) modello ARMA fornisce un buon modello in forma. Chiaramente questo dovrebbe essere il caso, in quanto weve simulato i dati stessi, tuttavia, è proprio questo il procedimento useremo quando veniamo per adattarsi ARMA (p, q) modelli per l'indice SampP500 nella sezione seguente. Dati Finanziari Ora che weve delineato la procedura per la scelta del modello di serie momento ottimale per una serie simulata, è piuttosto semplice da applicare ai dati finanziari. Per questo esempio ci accingiamo a scegliere ancora una volta il SampP500 indice azionario statunitense. Consente di scaricare i prezzi di chiusura giornalieri utilizzando quantmod e quindi creare il registro restituisce flusso: Lascia per eseguire la stessa procedura di montaggio come per il simulata ARMA (3,2) serie di cui sopra sulla serie rendimenti log del SampP500 utilizzando l'AIC: Il miglior modello di raccordo ha ordine ARMA (3,3): Consente di trama residui del modello montato sul SampP500 log rendimenti giornalieri streaming: si noti che ci sono alcuni picchi significativi, soprattutto a ritardi superiori. Questo è indicativo di una misura poveri. Consente di eseguire un test di Ljung-Box per vedere se abbiamo prove statistiche per questo: Come sospettavamo, il p-value è inferiore a 0,05 e come tale non possiamo dire che i residui sono una realizzazione di rumore bianco discreta. Quindi c'è autocorrelazione aggiuntivo nei residui che non si spiega con il modello adattato ARMA (3,3). Passi successivi Come weve discussi tutti insieme in questa serie di articoli abbiamo visto la prova di eteroschedasticità condizionale (clustering volatilità) nella serie SampP500, soprattutto nei periodi intorno a 2007-2008. Quando usiamo un modello GARCH più avanti nella serie di articoli vedremo come eliminare questi autocorrelazioni. In pratica, modelli ARMA sono mai generalmente buoni adatta per le azioni di registro ritorni. Abbiamo bisogno di prendere in considerazione la eteroscedasticità condizionale e utilizzare una combinazione di ARIMA e GARCH. Il prossimo articolo prenderà in considerazione ARIMA e mostrare come la componente integrato si differenzia dal modello ARMA abbiamo considerato in questo articolo. Appena iniziato con Quantitative TradingPractical risultati in simulazione e previsione Riferimenti Anis, A. A. e Lloyd, E. H. (1976) Il valore atteso della gamma regolata riscalato Hurst di addendi normali indipendenti, Biometrika 63, pp 111116. CrossRef Askew, A. J. Yeh, W. W.G. e Hall, WA (1971) uno studio comparativo della simulazione siccità critica, Water Resources Research 7, pp 5262. CrossRef Ballerini, R. e Boes, DC (1985) comportamento Hurst di spostare processo livello, risorse idriche Research 12, 11, pp 16421648. CrossRef Boes, DC e Salas, JD (1978) non stazionarietà della media e il fenomeno Hurst, Water Resources Research 14, 1, pp 135143. CrossRef Box, GEP e Cox, D. R. (1964) L'analisi delle trasformazioni, ufficiale della Royal Statistical Society, Serie B 26, pp 211252. Box, G. E.P. e Jenkins, G. M. (1976) Time Series Analysis: Previsione e controllo, Seconda Edizione, Holden-Day, San Francisco. Feller, W. (1951) La distribuzione asintotica della gamma di somme di variabili casuali indipendenti, Annals of Mathematical Statistics 22, pp 427432. CrossRef Fisher, R. A. (1970) Metodi statistici per ricercatori, Oliver e Boyd, Edimburgo, Regno Unito. Gnedenko, B. V. (1968) teoria della probabilità, Chelsea, New York. Granger, C. W.J. e Joyeux, R. (1980) Introduzione ai modelli di serie storiche di lungo memoria e differenziazione frazionaria, Journal of Time Series Analysis 1, pp 1529. CrossRef Hall, W. A. Askew, A. J. e Yeh, W. W.G. (1969) L'utilizzo del periodo critico nell'analisi serbatoio, risorse idriche Research 5, 6, pp 12051215. CrossRef Hipel, K. W. (1975) di modellazione contemporanea Box-Jenkins di risorse idriche, Ph. D. Tesi, Università di Waterloo, Waterloo, Ontario. Hipel, K. W. e McLeod, A. I. (1978a) Conservazione della gamma, 2, studi di simulazione corretti riscalati utilizzando modelli Box-Jenkins, Water Resources Research 14, 3, pp 509516. CrossRef Hipel, K. W. e McLeod, A. I. (1978b) La conservazione del range impostato riscalato, 3, algoritmi di rumore gaussiano frazionali, Water Resources Research 14, 3, pp 517518. CrossRef Hipel, K. W. e McLeod, A. I. (1993) Time Series Modellazione delle risorse idriche e sistemi ambientali, Elsevier, Amsterdam. Hipel, K. W. McBean, E. A. e McLeod, A. I. (1979) idrologico selezione del modello genera, ufficiale delle risorse idriche Progettazione e Gestione Divisione, ASCE 105, WR2, pp 223242. Hosking, J. R.M. (1981) differenziazione frazionale, Biometrika 68, pp 165.176 CrossRef Hosking, J. R.M. (1984) Modeling persistenza nel tempo di serie idrologiche mediante differenziazione frazionale, risorse idriche di ricerca 20, 12, pp 18981908. CrossRef Hurst, H. E. (1951) la capacità di archiviazione a lungo termine di serbatoi, operazioni della American Society of Civil Engineers 116, pp 770808. Hurst, H. E. (1956) I metodi di utilizzo di conservazione a lungo termine in serbatoi, Atti del Institute of Civil Engineers 1, pp 519543. CrossRef Jimenez, C. McLeod, A. I. e Hipel, K. W. (1989) di Kalman filtro di stima per i modelli medi periodiche autoregressivi movimento, stocastico idrologia e idraulica 3, 3, pp 229242. CrossRef Klemes, V. (1974) Il fenomeno Hurst: un puzzle, risorse idriche Research 10, 4, pp 675.688. CrossRef Li, WK e McLeod, A. I. (1986) frazionale serie di modellazione tempo, Biometrika 73, 1, pp 217221. CrossRef Mandelbrot, BB e Wallis, JR (1968) Noah, Giuseppe e l'idrologia operativa, Water Resources Research, 5,5, pp 909918. CrossRef Mandelbrot, BB e Wallis, JR (1969) esperimenti di computer con rumori gaussiana frazionali, parti da 1 a 3, Water Resources Research 5, pp 228267. CrossRef McLeod, aI (1975) Derivazione della funzione autocovarianza teorica di serie tempo medio autoregressiva movimento, ufficiale della Royal Statistical Society, Serie C (Applied Statistics) 24, 2, pp 255256. McLeod, A. I. e Hipel, K. W. (1978a) Conservazione del range impostato rwaled, 1, una nuova valutazione del fenomeno Hurst, risorse idriche Research 14, 3, pp 491508. CrossRef McLeod, A. I. e Hipel, K. W. (1978b) le procedure di simulazione per modelli Box-Jenkins, Water Resources Research 14, 5, pp 969975. CrossRef McLeod, A. I. Noakes, D. J. Hipel, K. W. e Thompstone, R. M. (1987) La combinazione di previsioni idrologiche, ufficiale delle risorse idriche Progettazione e Management Division, ASCE, 113, 1, pp 2941. CrossRef Moss, M. E. e Bryson, M. C. (1974) la struttura di autocorrelazione dei deflussi mensili, risorse idriche di ricerca 10, pp 737744. CrossRef Noakes, D. J. McLeod, A. I. e Hipel, K. W. (1985) Previsione serie mensile tempo Riverflow, International Journal of Forecasting 1, pp 179190. CrossRef Noakes, D. J. Hipel, K. W. McLeod, A. I. Jimenez, J. e Yakowitz, S. (1988) Previsione serie annuale tempo geofisica, International Journal of Forecasting 4, pp 103115. CrossRef Pitman, E. J.G. (1939) Una nota sulla correlazione normale, Biometrika 31, pp 912. Ralston, A. (1965) Un primo corso di Analisi Numerica, McGraw-Hill, New York. Rao, C. R. (1973) lineare statistica Inference e delle sue applicazioni, Second Edition, John Wiley, New York. CrossRef Salas, J. D. e Boes, a corrente continua (1980) Spostamento livello di modellazione di serie idrologica, i progressi nella Risorse Idriche 3, pp 5963. CrossRef Salas, J. D. Boes, in corrente continua, Yevjevich, V. e Pegram, G. G.S. (1979) fenomeno Hurst come un comportamento pre-asintotico, Journal of Hydrology 44, pp 115. CrossRef Salas, J. D. Delleur, J. W. Yevjevich, V. e Lane, W. L. (1980) Modellazione Applicata di Hydrologic Series, risorse idriche Publications, Littleton, Colorado. Thompstone, R. M. Hipel, K. W. e McLeod, A. I. (1983) di trasferimento di modellazione funzione di rumore per la previsione centrale elettrica afflusso, INFOR 21, PP 258.269 Thompstone, R. M. Hipel, K. W. e McLeod, A. I. riverflows (1985) Previsione quarto di mensili, risorse idriche Bulletin 21, 5, pp 731741. CrossRef Thompstone, R. M. Hipel, K. W. e McLeod, A. I. (1987) Simulazione di serie temporali idrologiche mensili, in I. B. MacNeill e G. J. Umphrey (a cura di), A. I. McLeod (assoc. ed.), Advances in Scienze Statistiche, Festschrift in onore del professore V. M. Joshis 70 ° compleanno, vol. IV, stocastico Idrologia, D. Reidel Publishing Co. Dordrecht, Paesi Bassi, pp 5771. Vogel, R. M. e Stedinger, JR (1988) il valore dei modelli stocastici deflusso in applicazioni di design serbatoio oltre anni, Water Resources Research 24, 9, pp 14831490. CrossRef Wilcoxon, F. (1945) i confronti individuali con metodi ranking, Biometrics 1, pp 8083 . CrossRef Yakowitz, SJ (1985a) stima della densità non parametrica e previsione per le sequenze di Markov, ufficiale American Statistical Association 80, pp 215221. CrossRef Yakowitz, S. J. modelli di flusso (1985b) Markov e il problema allarme inondazioni, Water Resources Research 21, pp 8188. CrossRefAutoregressive Moving-Media Generator Il processo a media mobile autoregressiva (ARMA) è un tempo discreto e continuo dello stato processo casuale. Questo generatore sceglie a caso i parametri del modello da l'intervallo è possibile impostare la condizione per (debole) stazionarietà. Parte della produzione include la funzione di autocorrelazione (ACF), funzione di autocorrelazione parziale (PACF), e loro campioni (SACF, SPACF), che servono come strumento di base per l'identificazione del modello nell'approccio Box8211Jenkins, cercando per il cosiddetto cut-off points. Autoregressive media mobile di simulazione (First Order) la manifestazione è impostato in modo tale che la stessa serie casuale di punti viene utilizzato, non importa quanto le costanti e sono molteplici. Tuttavia, quando si preme il pulsante quotrandomizequot, una nuova serie casuale viene generato e utilizzato. Mantenendo la serie casuale identico permette all'utente di vedere esattamente gli effetti sulla serie ARMA delle variazioni delle due costanti. La costante è limitata a (-1,1) a causa divergenza dei risultati della serie ARMA quando. La dimostrazione è solo un processo di primo ordine. termini AR supplementari permetterebbero serie più complesse da generare, mentre i termini MA aggiuntivi aumenterebbero la levigatura. Per una descrizione dettagliata dei processi ARMA, si veda, ad esempio, G. di sicurezza, G. M. Jenkins, e G. Reinsel, Tempo Analisi Serie: Previsione e controllo. 3a ed. Englewood Cliffs, NJ: Prentice-Hall, 1994. link correlati

No comments:

Post a Comment