En RIMA står för autoregressiva integrerade rörliga genomsnittsmodeller Univariate singelvektor ARIMA är en prognosteknik som projekterar framtida värden för en serie baserad helt på egen tröghet. Den huvudsakliga applikationen är inom området för prognos på kort sikt som kräver minst 40 historiska datapunkter. Fungerar bäst när dina data uppvisar ett stabilt eller konsekvent mönster över tiden med en minimal mängd avvikare. Ibland kallas Box-Jenkins efter de ursprungliga författarna, är ARIMA vanligtvis överlägsen exponentiell utjämningsteknik när data är relativt långa och korrelationen mellan tidigare observationer är stabil Om data är korta eller mycket flyktiga, kan en viss utjämningsmetod fungera bättre Om du inte har minst 38 datapunkter, bör du överväga någon annan metod än ARIMA. Det första steget i att tillämpa ARIMA-metodiken är att kontrollera stationäritet Stationaritet innebär att serien förblir på en ganska konstant nivå över tiden Om en trend existerar, som i de flesta eko nominella eller affärsapplikationer, då är dina data INTE stationära. Datan ska också visa en konstant varians i sina fluktuationer över tid. Detta syns lätt med en serie som är väldigt säsongsbetonad och växer i snabbare takt. I så fall är upp - och nedgångarna i säsongsheten kommer bli mer dramatisk över tiden Utan att dessa stationära förhållanden är uppfyllda kan många av beräkningarna associerade med processen inte beräknas. Om en grafisk del av data indikerar icke-stationaritet, bör du skilja på serien. Differentiering är ett utmärkt sätt att omvandla en icke-stationär serie till en stationär en Detta görs genom att subtrahera observationen i den aktuella perioden från den föregående. Om denna omvandling görs endast en gång till en serie, säger du att data har först skiljats. Denna process eliminerar i huvudsak trenden om Din serie växer i en ganska konstant takt Om den växer i en ökande takt kan du tillämpa samma procedur och skilja Ange data igen Din data skulle då bli annorlunda. Autokorrelationer är numeriska värden som indikerar hur en dataserie är relaterad till sig själv över tiden Mer precist mäter det hur starkt datavärdena vid ett visst antal perioder i varandra är korrelerade till varandra över tiden Antalet perioder ibland kallas vanligtvis lagret För Exempelvis mäter en autokorrelation vid lag 1 hur värdena 1 period från varandra korreleras med varandra i serien. En autokorrelation vid lag 2 mäter hur data två perioder i varandra korreleras genom serien. Autokorrelationer kan sträcka sig från 1 till -1 Ett värde nära 1 indikerar en hög positiv korrelation medan ett värde nära -1 innebär en hög negativ korrelation Dessa mätningar utvärderas oftast genom grafiska plottar som kallas korrelagram. Ett korrelagram avbildar autokorrelationsvärdena för en given serie på olika nivåer. Detta kallas autokorrelationsfunktionen och är mycket viktigt i ARIMA-metoden. ARIMA-metoden försöker beskriva rörelserna i en stationära tidsserier som en funktion av vad som kallas autoregressiva och rörliga genomsnittsparametrar. Dessa kallas AR-parametrar, autogegsiva och MA-parametrar som rör medeltal. En AR-modell med endast 1 parameter kan skrivas som. var X t-tidsserier som undersöks. A 1 Den autoregressiva parametern i ordning 1.X t-1 tidsserien lagrade 1 period. E t felet i modellen. Detta innebär helt enkelt att vilket givet värde Xt som helst kan förklaras med någon funktion av sitt tidigare värde, X t - 1, plus något oförklarligt slumpmässigt fel, E t Om det uppskattade värdet på A 1 var 30, skulle serievärdet nu vara relaterat till 30 av dess värde 1 period sedan Naturligtvis skulle serien kunna relateras till mer än bara Ett förflutet värde. Exempelvis. X t A 1 X t-1 A 2 X t-2 E t. Detta indikerar att det aktuella värdet av serien är en kombination av de två omedelbart föregående värdena, X t-1 och X t - 2, plus lite slumpmässigt fel E t Vår modell är nu en autoregressiv modell av ordning 2.Moving Aver Åldersmodeller. En andra typ av Box-Jenkins-modell kallas en rörlig genomsnittsmodell. Även om dessa modeller ser väldigt ut som AR-modellen är konceptet bakom dem ganska olika. Rörande genomsnittsparametrar relaterar vad som händer i period t endast till de slumpmässiga fel som inträffade under tidigare tidsperioder, dvs E t-1, E t-2, etc snarare än till X t-1, X t-2, Xt-3 som i de autoregressiva metoderna. En rörlig genomsnittsmodell med en MA-term kan skrivas Som följer. Termen B 1 kallas en MA i ordning 1 Negativt tecken framför parametern används endast för konventionellt och skrivs vanligen automatiskt ut av de flesta datorprogram. Ovanstående modell säger helt enkelt att ett givet värde av X t är direkt relaterat endast till det slumpmässiga felet i föregående period, E t-1, och till den aktuella felperioden, E t Som i fall av autregressiva modeller kan de rörliga genomsnittsmodellerna utvidgas till högre orderstrukturer som täcker olika kombinationer Och glidande medellängder. ARIMA metodologi als o tillåter modeller att byggas som innehåller både autoregressiva och glidande medelparametrar tillsammans. Dessa modeller kallas ofta som blandade modeller. Även om detta ger ett mer komplicerat prognosverktyg kan strukturen verkligen simulera serien bättre och producera en mer exakt prognos. Rena modeller antyder att strukturen bara består av AR - eller MA-parametrar - inte båda. Modellerna som utvecklas genom denna metod kallas vanligtvis ARIMA-modeller eftersom de använder en kombination av autoregressiv AR, integration I - hänvisar till omvänd process för differentiering för att producera prognosen, och flyttande genomsnittliga MA-operationer En ARIMA-modell anges vanligtvis som ARIMA p, d, q Detta representerar ordningen för de autogegrativa komponenterna p, antalet differeneringsoperatörer d och den högsta ordningen av den glidande medelfristen. Exempelvis ARIMA 2, 1,1 betyder att du har en andra ordningsautoregressiv modell med en första ordning som rör den genomsnittliga komponenten vars serie har differentierats onc e för att inducera stationaritet. Att hitta rätt specifikation. Huvudproblemet i klassiska Box-Jenkins försöker bestämma vilken ARIMA-specifikation som ska användas - hur många AR - och MA-parametrar som ska inkluderas. Detta är vad mycket av Box-Jenkings 1976 ägde rum åt identifieringsprocessen Det berodde på grafisk och numerisk utvärdering av provautokorrelationen och partiella autokorrelationsfunktionerna. För dina basmodeller är uppgiften inte för svår. Varje har autokorrelationsfunktioner som ser på ett visst sätt Men när du går upp i komplexitet , mönstren är inte så lätt detekterade För att göra det svårare, representerar dina data bara ett urval av den underliggande processen. Det betyder att provtagningsfelsutjämnare, mätfel mm kan snedvrida den teoretiska identifieringsprocessen. Därför är traditionell ARIMA-modellering en konst Snarare än en science. Purpose Check Randomness. Autocorrelation plots Box och Jenkins, sid 28-32 är ett vanligt använt verktyg för att kontrollera randomn Ess i en dataset Denna slumpmässighet bestäms genom att beräkna autokorrelationer för datavärden vid olika tidsfördröjningar. Om slumpmässigt skulle sådana autokorrelationer vara nära noll för alla tidsfördröjningar. Om inte slumpmässigt kommer en eller flera av autokorrelationerna att vara Väsentligen icke-zero. In addition autocorrelation tomter används i modellen identifieringssteget för Box-Jenkins autoregressiva, rörliga genomsnittliga tidsserier models. Autocorrelation är bara ett mått på slumpmässighet. Notera att okorrelerade inte nödvändigtvis betyder slumpmässiga data som har betydande autokorrelation Är inte slumpmässigt. Data som inte visar signifikant autokorrelation kan emellertid fortfarande uppvisa icke-slumpmässighet på andra sätt. Autokorrelation är bara ett mått på slumpmässighet. I samband med modellvalidering som är den primära typen av slumpmässighet vi dikterar i Handboken, kontrollerar autokorrelation Är vanligtvis ett tillräckligt test av slumpmässighet eftersom resterna från en dålig passande modell tenderar att visa icke - subtle randomness Men vissa applikationer kräver en mer bestämd bestämning av slumpmässighet. I dessa fall kan ett testtest, vilket kan innefatta kontroll av autokorrelation, tillämpas eftersom data kan vara slumpmässigt på många olika och ofta subtila sätt. Ett exempel på där en mer noggrann kontroll för slumpmässighet behövs skulle vara i testning av slumptalsgeneratorer. Provplottautokorrelationer bör vara nära noll för slumpmässighet. Så är inte fallet i detta exempel och således slumpmässigt antagandet misslyckas. Detta prov autokorrelationsplot visar att tiden Serier är inte slumpmässiga utan har snarare en hög grad av autokorrelation mellan intilliggande och närliggande intilliggande observationer. Definitionen rh mot h. Autocorrelation plots bildas av. Autocorrelationskoefficienten för autentisk axel. Där Ch är autokovariansfunktionen. Och C0 är Variansfunktion. Notera att R h är mellan -1 och 1. Notera att vissa källor kan använda följande formel för autokovariansfunktionen. Även om detta d efinition har mindre bias, har 1 N formuleringen några önskvärda statistiska egenskaper och är den form som brukar användas i statistiklitteraturen Se sidorna 20 och 49-50 i Chatfield för detaljer. Horisontell axel Tidslagsvisning hh 1, 2, 3.Den ovanstående linjen innehåller också flera horisontella referenslinjer Mellanlinjen är vid noll De övriga fyra linjerna är 95 och 99 konfidensband Observera att det finns två distinkta formler för att generera förtroendeband. Om autokorrelationsplanen används för att testa för slumpmässighet, dvs det finns Inget tidsberoendet i data rekommenderas följande formel. Där N är provstorleken, z är den kumulativa fördelningsfunktionen för normal normalfördelning och alfa är signifikansnivån. I detta fall har konfidensbanden en fast bredd som beror på Provstorleken Detta är den formel som användes för att generera konfidensbanden i ovanstående plot. Utföringsintervall används också i modellidentifieringssteget för montering av AR IMA-modeller I detta fall antas en glidande genomsnittsmodell för data och följande förtroendeband ska genereras. Där k är lagret, N är provstorleken, z är den kumulativa fördelningsfunktionen för normal normalfördelning och alfa är Signifikansnivån I detta fall ökar konfidensbandet när fördröjningen ökar. Autokorrelationsdiagrammet kan ge svar på följande frågor. Uppgifterna är slumpmässiga. En observation relaterad till en intilliggande observation. Det är en observation som är relaterad till en observation två gånger borttagen etc. Is den observerade tidsserien white noise. Is observerade tidsserie sinusoidal. Is observerade tidsserier autoregressive. What är en lämplig modell för observerade tidsserier. Är modellen. valid och tillräcklig. Är formeln ss sqrt giltig. Importance Säkerställ giltighet av tekniska slutsatser. Randomhet tillsammans med fast modell, fast variation och fast distribution är ett av de fyra antaganden som typiskt ligger till grund för alla mätningar p rocesses Slumpmässigt antagande är kritiskt viktigt av följande tre skäl. De flesta standard statistiska testen beror på slumpmässighet. Testresultatets giltighet är direkt kopplad till giltighetstiden för slumpmässigt antagande. Många vanliga statistiska formler beror på slumpmässigt antagande vanligaste formeln är formeln för att bestämma standardavvikelsen för provet mean. where s är standardavvikelsen för data. Även om det är tungt använd, är resultaten från att använda denna formel inget värde om inte slumpmässiga antaganden håller. För univariata data, standardmodellen är. Om data inte är slumpmässiga är denna modell felaktig och ogiltig, och uppskattningarna för parametrarna som konstanten blir oanständiga och ogiltiga. Kort sagt, om analytikern inte kontrollerar slumpmässighet, så gäller många Av de statistiska slutsatserna blir misstänkta Autocorrelation plot är ett utmärkt sätt att kolla efter sådan slumpmässighet.2 1 Flytta Avera ge modellerna MA modeller. Tidsseriemodeller som kallas ARIMA-modeller kan innefatta autoregressiva termer och eller glidande medelvärden. I vecka 1 lärde vi oss en autoregressiv term i en tidsseriemodell för variabeln. xt är ett fördröjt värde på xt. Till exempel en fördröjning 1 autoregressiv term är x t-1 multiplicerad med en koefficient Denna lektion definierar glidande medelvärden. En glidande medelfrist i en tidsseriemodell är ett tidigare fel multiplicerat med en koefficient. Låt wt överskridas N 0, sigma 2w, vilket betyder att wt Är identiskt oberoende fördelade, var och en med en normal fördelning med medelvärde 0 och samma varians. Den 1 st ordningsrörande genomsnittsmodellen betecknad med MA 1 är. Xt mu wt theta1w. Den 2: a beställer rörlig genomsnittsmodell, betecknad med MA 2 är. Xt mu wt theta1w theta2. Den q-ordningsrörelserna medellägesmodellen, betecknad med MA q är. Xt mu wt theta1w theta2w prickar thetaqw. Note Många läroböcker och programvara definierar modellen med negativa tecken före villkoren. Detta förändrar inte de allmänna teoretiska egenskaperna hos modellen, även om den vrider de algebraiska tecknen på uppskattade koefficientvärden och oskydda termer i Formler för ACF och avvikelser Du måste kontrollera din programvara för att verifiera om negativa eller positiva tecken har använts för att korrekt skriva den beräknade modellen R använder positiva tecken i sin underliggande modell, som vi gör här. De teoretiska egenskaperna hos en tidsserie med En MA 1-modell. Notera att det enda nonzero-värdet i teoretiskt ACF är för lag 1 Alla andra autokorrelationer är 0 Således är ett sampel ACF med en signifikant autokorrelation endast vid lag 1 en indikator på en möjlig MA 1-modell. För intresserade studenter, Bevis på dessa egenskaper är en bilaga till denna handout. Exempel 1 Antag att en MA 1-modell är xt 10 wt 7 w t-1 där wt överför N 0,1 Således koefficienten 1 0 7 Th E teoretisk ACF ges av. En plot av denna ACF följer. Den plott som just visas är den teoretiska ACF för en MA 1 med 1 0 7 I praktiken har ett prov som vunnits t ge ett så tydligt mönster. Med hjälp av R simulerade vi n 100 Provvärden med hjälp av modellen xt 10 wt 7 w t-1 där w t. iid N 0,1 För denna simulering följer en tidsserieplot av provdata. Vi kan inte berätta mycket av denna plot. Provet ACF för den simulerade data följer Vi ser en spik vid lag 1 följt av allmänt icke-signifikanta värden för lags över 1 Observera att provet ACF inte matchar det teoretiska mönstret för den underliggande MA 1, vilket är att alla autokorrelationer för lags över 1 kommer att vara 0 A Olika prov skulle ha ett något annorlunda prov ACF som visas nedan, men skulle troligen ha samma breda egenskaper. Deoretiska egenskaperna hos en tids serie med en MA 2-modell. För MA 2-modellen är de teoretiska egenskaperna följande. Notera att den enda nonzero värden i teoretisk ACF är för lags 1 och 2 autocorrelat Joner för högre lags är 0 Så, ett ACF-prov med signifikanta autokorrelationer vid lags 1 och 2, men icke-signifikanta autokorrelationer för högre lags indikerar en möjlig MA 2-modell. N 0,1 Koefficienterna är 1 0 5 och 2 0 3 Eftersom detta är en MA 2, kommer den teoretiska ACF endast att ha nonzero-värden endast vid lags 1 och 2.Values av de två icke-oberoende autokorrelationerna är. En plot av den teoretiska ACF följer. Som nästan alltid är fallet, samplingsdata som vunnit t uppträder ganska Så perfekt som teori Vi simulerade n 150 provvärden för modellen xt 10 wt 5 w t-1 3 w t-2 var w t. iid N 0,1 Tidsseriens plot av data följer Som med tidsseriens plot för MA 1-provdata kan du inte berätta mycket för. Provet ACF för den simulerade data följer Mönstret är typiskt för situationer där en MA 2-modell kan vara användbar. Det finns två statistiskt signifikanta spikar vid lags 1 och 2 följt av icke - - värda värden för andra lags Observera att på grund av provtagningsfel stämde provet ACF inte Det teoretiska mönstret exactly. ACF för General MA q Models. A egenskap av MA q modeller i allmänhet är att det finns icke-oberoende autokorrelationer för de första q lagsna och autokorrelationerna 0 för alla lags q. Non-unikhet av samband mellan värdena på 1 och rho1 I MA 1-modell. I MA 1-modellen, för vilket värde som helst av 1, ger den ömsesidiga 1 1 samma värde. För exempel, använd 0 5 för 1 och använd sedan 1 0 5 2 för 1 Du får rho1 0 4 I båda fallen. För att tillfredsställa en teoretisk begränsning som kallas invertibilitet begränsar vi MA1-modellerna till att ha värden med absolutvärdet mindre än 1 I exemplet just givet är 1 0 5 ett tillåtet parametervärde medan 1 1 0 5 2 inte kommer att. Invertibility av MA modeller. En MA-modell sägs vara omvändbar om den är algebraiskt ekvivalent med en konvergerande oändlig ordning AR-modell. Genom konvertering menar vi att AR-koefficienterna minskar till 0 när vi flyttar tillbaka i tiden. Invertibility är en begränsning programmerad till tidsserie programvara som används för att uppskatta coeff icients of models med MA termer Det är inte något vi söker efter i dataanalysen Ytterligare information om invertibility-begränsningen för MA 1-modeller finns i bilagan. Avancerad teorinotering För en MA q-modell med en specificerad ACF finns det endast en omvänd modell Den nödvändiga förutsättningen för invertibilitet är att koefficienterna har värden så att ekvationen 1- 1 y - qyq 0 har lösningar för y som faller utanför enhetens cirkel. R Kod för exemplen. I exempel 1 ritade vi Teoretisk ACF av modellen xt 10 wt 7w t-1 och sedan simulerade n 150 värden från denna modell och ritade provtidsserierna och provet ACF för de simulerade data R-kommandona som användes för att plotta den teoretiska ACF var. acfma1 ARMAacf ma c 0 7, 10 lags av ACF för MA 1 med theta1 0 7 lags 0 10 skapar en variabel som heter lags som sträcker sig från 0 till 10 plot lags, acfma1, xlim c 1,10, ylab r, typ h, huvud ACF för MA 1 med theta1 0 7 abline h 0 lägger en horisontell axel till plot. Th E första kommandot bestämmer ACF och lagrar det i ett objekt med namnet acfma1 vårt val av namn. Plot-kommandot 3: e kommandotyperna lags mot ACF-värdena för lags 1 till 10 ylab-parametern markerar y-axeln och huvudparametern sätter en titel på plottet. För att se de numeriska värdena för ACF använder du bara kommandot acfma1. Simuleringen och diagrammen gjordes med följande kommandon. Lista ma c 0 7 Simulerar n 150 värden från MA 1 x xc 10 lägger till 10 för att göra medelvärdet 10 Simulering standardvärden betyder 0 diagram x, typ b, huvud Simulerat MA 1 data acf x, xlim c 1,10, huvud ACF för simulerade provdata. I exempel 2 ritade vi den teoretiska ACF av modellen xt 10 wt 5 w t-1 3 w t-2 och simulerade sedan n 150 värden från denna modell och ritade provtidsserierna och provet ACF för den simulerade Data R-kommandona som användes var. acfma2 ARMAacf ma c 0 5,0 3, acfma2 lags 0 10 plot lags, acfma2, xlim c 1,10, ylab r, typ h, huvud ACF för MA2 med theta1 O5, theta2 O 3 abline h 0 lista ma c 0 5, 0 3 x xc 10 plot x, typ b, huvud Simulerad MA 2-serie acf x, xlim c 1,10, huvud ACF för simulerade MA 2 Data. Appendix Bevis av egenskaper hos MA 1 . För intresserade studenter är här bevis på teoretiska egenskaper hos MA 1-modellen. Variantext xt text mu wt theta1 w 0 text wt text theta1w sigma 2w theta 21 sigma 2w 1 theta 21 sigma 2When h 1, föregående uttryck 1 W 2 För någon h 2 , Det föregående uttrycket 0 Anledningen är att, enligt definitionen av oberoende av Wt E wkwj 0 för någon kj vidare, eftersom wt har medelvärdet 0, E wjwj E wj 2 w 2.For en tidsserie. Använd detta resultat för att få ACF ges ovan. En inverterbar MA-modell är en som kan skrivas som en oändlig ordning AR-modell som konvergerar så att AR-koefficienterna konvergerar till 0 när vi rör sig oändligt tillbaka i tiden. Vi ska visa omvändlighet för MA 1-modellen. Vi då Substitutionsförhållande 2 för w t-1 i ekvation 1. 3 zt wt theta1 z-theta1w wt theta1z-theta 2w. At tiden t-2 ekvation 2 blir. Vi ersätter sedan förhållandet 4 för w t-2 i ekvation 3. zt wt Theta1 z - theta 21w wt theta1z - theta 21 z - theta1w wt theta1z - theta1 2z theta 31.Om vi skulle fortsätta oändligt, skulle vi få oändlig ordning AR - modellen. Zt wt theta1 z - theta 21z theta 31z - theta 41z prickar. Observera att om 1 1 kommer koefficienterna som multiplicerar lagren av z ökar oändligt i storlek när vi flyttar tillbaka i tiden. För att förhindra detta behöver vi 1 1 Detta är Villkoret för en inverterbar MA 1-modell. Infinite Order MA-modellen. I vecka 3 ser vi att en AR 1-modell kan konverteras till en oändlig MA-modell. Xt - mu wt phi1w phi 21w prickar phi k1 w prickar summa phi j1w. Denna summering av tidigare vita ljudvillkor är känd som kausalrepresentation av en AR 1 Med andra ord är xt en speciell typ MA med ett oändligt antal termer Går tillbaka i tid Detta kallas ett oändligt order MA eller MA En ändlig ordning MA är en oändlig ordning AR och någon ändlös ordning AR är en oändlig ordning MA. Recall i vecka 1 noterade vi att ett krav på en stationär AR 1 är att 1 1 Låt oss beräkna Var xt med hjälp av kausalrepresentationen. Detta sista steg använder ett grundläggande fakta om geometriska serier som kräver phi1 1 annars skiljer serien bort.
No comments:
Post a Comment