Sunday 8 October 2017

Glidande Medelvärde Förenklat


Flyttande medelvärde. Detta exempel lär dig hur man beräknar det glidande medlet av en tidsserie i Excel. Ett glidande medel används för att släpa ut oregelbundenheter toppar och dalar för att enkelt kunna känna igen trenderna. 1 Först, låt oss ta en titt på vår tidsserie.2 På Datafliken klickar du på Data Analysis. Note kan inte hitta knappen Data Analysis Klicka här för att ladda till verktyget Add-in Analysis ToolPak.3 Välj Flytta genomsnitt och klicka på OK.4 Klicka på rutan Inmatningsområde och välj intervallet B2 M2. 5 Klicka i rutan Intervall och skriv 6.6 Klicka i rutan Utmatningsområde och välj cell B3.8 Skriv ett diagram över dessa värden. Planering eftersom vi anger intervallet till 6 är det rörliga genomsnittet genomsnittet för de föregående 5 datapunkterna och Den aktuella datapunkten Som ett resultat utjämnas toppar och dalar Grafen visar en ökande trend Excel kan inte beräkna det glidande medlet för de första 5 datapunkterna eftersom det inte finns tillräckligt med tidigare datapunkter.9 Upprepa steg 2 till 8 för intervall 2 Och intervall 4.Konklusion Den la rger intervallet desto mer topparna och dalarna utjämnas. Ju mindre intervallet desto närmare de rörliga medelvärdena ligger till de faktiska datapunkterna. Genom att använda genomsnittliga och exponentiella utjämningsmodeller. Som ett första steg för att flytta bortom genomsnittliga modeller, slumpmässiga gångmodeller , och linjära trendmodeller, nonseasonal mönster och trender kan extrapoleras med hjälp av en rörlig genomsnitts - eller utjämningsmodell. Det grundläggande antagandet bakom medelvärdes - och utjämningsmodeller är att tidsserierna är lokalt stationära med ett långsamt varierande medelvärde. Därför tar vi ett rörligt lokalt genomsnitt att uppskatta det nuvarande värdet av medelvärdet och sedan använda det som prognosen för den närmaste framtiden Detta kan betraktas som en kompromiss mellan medelmodellen och slumpmässig promenad utan driftmodell Samma strategi kan användas för att uppskatta och Extrapolera en lokal trend Ett glidande medel kallas ofta en jämn version av originalserien eftersom kortfristig medelvärde har en effekt att utjämna bubblorna i originalserien. Genom en justering av graden av utjämning av det rörliga genomsnittets bredd kan vi hoppas att hitta någon form av optimal balans mellan prestandan hos medel - och slumpmässiga gångmodeller. Den enklaste typen av medelvärdesmodell är det enkla lika viktade rörliga genomsnittet. Prognosen För värdet av Y vid tiden t 1 som är gjord vid tiden t motsvarar det enkla medelvärdet av de senaste m-observationerna. Här och på andra ställen kommer jag att använda symbolen Y-hat för att kunna förutse en prognos av tidsserie Y som gjorts så tidigt som möjligt före en given modell. Detta medel är centrerat vid period-m 1 2, vilket innebär att uppskattningen av Den lokala medelvärdet tenderar att ligga bakom det verkliga värdet av det lokala medelvärdet med ca m 1 2 perioder Således säger vi att medeltal för data i det enkla glidande medlet är m 1 2 relativt den period som prognosen beräknas för det här är hur lång tid prognoserna tenderar att ligga bakom vändpunkterna i data. Om du till exempel medger de senaste 5 värdena kommer prognoserna att vara cirka 3 perioder sent för att svara på vändpunkter. Observera att om m 1, Den enkla glidande SMA-modellen motsvarar den slumpmässiga promenadmodellen utan tillväxt Om m är mycket stor jämförbar med längden av uppskattningsperioden är SMA-modellen lika med medelmodellen. Som med vilken parameter som helst av en prognosmodell är det vanligt för att justera värdet på ki n för att få den bästa passformen till data, dvs de minsta prognosfelen i genomsnitt. Här är ett exempel på en serie som verkar uppvisa slumpmässiga fluktuationer runt ett långsamt varierande medel. Låt oss försöka passa det med en slumpmässig promenad modell, vilket motsvarar ett enkelt glidande medelvärde av 1 term. Slumpmässig gångmodell svarar väldigt snabbt på förändringar i serien, men därigenom väljer den mycket av bruset i data, de slumpmässiga fluktuationerna samt signalen den lokala medelvärde Om vi ​​istället försöker ett enkelt glidande medelvärde på 5 termer får vi en snyggare uppsättning prognoser. Det 5-åriga enkla glidande medlet ger betydligt mindre fel än den slumpmässiga gångmodellen i detta fall Medelåldern för data i detta prognosen är 3 5 1 2, så att den tenderar att ligga bakom vändpunkter med cirka tre perioder. Till exempel verkar en nedgång ha skett i period 21, men prognoserna vänder inte om till flera perioder senare. Notera att den långsiktiga termiska prognoser från SMA mod el är en horisontell rak linje, precis som i den slumpmässiga promenadmodellen. Således antar SMA-modellen att det inte finns någon trend i data. Även om prognoserna från slumpmässig promenadmodellen helt enkelt motsvarar det senast observerade värdet, kommer prognoserna från SMA-modellen är lika med ett vägt genomsnitt av de senaste värdena. De konfidensbegränsningar som beräknas av Statgraphics för de långsiktiga prognoserna för det enkla rörliga genomsnittet blir inte större eftersom prognosen för horisonten ökar. Detta är uppenbarligen inte korrekt. Tyvärr finns ingen underliggande statistisk teori som berättar hur förtroendeintervallen borde öka för denna modell. Det är emellertid inte så svårt att beräkna empiriska uppskattningar av konfidensgränserna för prognosen för längre horisont. Till exempel kan du skapa ett kalkylblad där SMA-modellen skulle användas för att prognostisera två steg framåt, 3 steg framåt, etc inom det historiska dataprovet. Du kan sedan beräkna provstandardavvikelserna av fel vid varje prognos h orizon och konstruera sedan konfidensintervaller för längre siktprognoser genom att lägga till och subtrahera multiplar av lämplig standardavvikelse. Om vi ​​försöker ett 9-sikt enkelt glidande medelvärde får vi ännu smidigare prognoser och mer av en långsammare effekt. Medelåldern är Nu 5 perioder 9 1 2 Om vi ​​tar ett 19-årigt glidande medelvärde, ökar medeltiden till 10. Notera att prognoserna nu försvinner nu bakom vändpunkter med cirka 10 perioder. Vilken mängd utjämning är bäst för denna serie Här är en tabell som jämför deras felstatistik, inklusive ett 3-årigt genomsnitt. Modell C, det 5-åriga glidande genomsnittet, ger det lägsta värdet av RMSE med en liten marginal över de tre och 9-siktiga genomsnitten, och Deras andra statistik är nästan identiska Så, bland modeller med mycket liknande felstatistik kan vi välja om vi föredrar lite mer lyhördhet eller lite mer jämnhet i prognoserna. Tillbaka till början av sidan. Brons s Exponentiell utjämning exponentiellt vägd glidande medelvärdet. Den enkla glidande medelmodellen beskriven ovan har den oönskade egenskapen som den behandlar de senaste k-observationerna lika och fullständigt ignorerar alla föregående observationer Intuitivt bör tidigare data diskonteras mer gradvis - till exempel bör den senaste observationen Få lite mer vikt än 2: a senast och 2: a senast bör få lite mer vikt än den 3: e senaste, och så vidare. Den enkla exponentiella utjämning SES-modellen åstadkommer detta. Låt beteckna en utjämningskonstant ett tal mellan 0 och 1 Ett sätt att skriva modellen är att definiera en serie L som representerar den aktuella nivån, dvs det lokala medelvärdet av serien som uppskattat från data upp till idag. Värdet av L vid tid t beräknas rekursivt från sitt eget tidigare värde som detta. Således är det nuvarande utjämnade värdet en interpolation mellan det tidigare jämnda värdet och den aktuella observationen, där kontrollen av det interpolerade värdet är så nära som möjligt cent observation Prognosen för nästa period är helt enkelt det nuvarande utjämnade värdet. Evivalent kan vi uttrycka nästa prognos direkt i form av tidigare prognoser och tidigare observationer, i någon av följande ekvivalenta versioner I den första versionen är prognosen en interpolering Mellan föregående prognos och tidigare observation. I den andra versionen erhålls nästa prognos genom att justera föregående prognos i riktning mot det föregående felet med en bråkdel. Erroren vid tidpunkten t I den tredje versionen är prognosen en exponentiellt viktad dvs diskonterat glidande medelvärde med rabattfaktor 1.Interpoleringsversionen av prognosformuläret är det enklaste att använda om du implementerar modellen på ett kalkylblad som passar i en enda cell och innehåller cellreferenser som pekar på föregående prognos, föregående observation och cellen där värdet av lagras. Notera att om 1, motsvarar SES-modellen en slumpmässig promenadmodell wit träväxt Om 0, motsvarar SES-modellen den genomsnittliga modellen, förutsatt att det första släta värdet sätts lika med medelvärdet Return to top of the page. Den genomsnittliga åldern för data i prognosen för enkel exponentiell utjämning är 1 relativ till den period som prognosen beräknas för. Detta är inte tänkt att vara uppenbart, men det kan enkelt visas genom att utvärdera en oändlig serie. Därför tenderar den enkla glidande genomsnittliga prognosen att ligga bakom vändpunkter med cirka 1 period. Till exempel när 0 5 fördröjningen är 2 perioder när 0 2 fördröjningen är 5 perioder då 0 1 fördröjningen är 10 perioder och så vidare. För en given medelålder, dvs mängden fördröjning, är den enkla exponentiella utjämning SES-prognosen något överlägsen den enkla rörelsen genomsnittlig SMA-prognos eftersom den lägger relativt större vikt vid den senaste observationen - det är något mer responsivt på förändringar som inträffade under det senaste. Till exempel har en SMA-modell med 9 villkor och en SES-modell med 0 2 båda en genomsnittlig ålder av 5 för da ta i sina prognoser, men SES-modellen lägger mer vikt på de senaste 3 värdena än SMA-modellen och samtidigt glömmer det inte helt värderingar som är mer än 9 perioder gamla, vilket visas i det här diagrammet. En annan viktig fördel med SES-modellen över SMA-modellen är att SES-modellen använder en utjämningsparameter som är kontinuerligt variabel så att den lätt kan optimeras genom att använda en solveralgoritm för att minimera medelkvadratfelet. Det optimala värdet av SES-modellen för denna serie visar sig Att vara 0 2961, som visas här. Medelåldern för data i denna prognos är 1 0 2961 3 4 perioder, vilket liknar det för ett 6-sikt enkelt glidande medelvärde. De långsiktiga prognoserna från SES-modellen är En horisontell rak linje som i SMA-modellen och den slumpmässiga promenadmodellen utan tillväxt Men notera att de konfidensintervaller som beräknas av Statgraphics nu avviker på ett rimligt sätt och att de är väsentligt smalare än förtroendeintervallet för rand Om walk-modellen SES-modellen förutsätter att serien är något mer förutsägbar än den slumpmässiga promenadmodellen. En SES-modell är egentligen ett speciellt fall av en ARIMA-modell, så den statistiska teorin om ARIMA-modeller ger en bra grund för att beräkna konfidensintervaller för SES-modell SES-modellen är speciellt en ARIMA-modell med en icke-säsongsskillnad, en MA 1-term och ingen konstant term som annars kallas en ARIMA 0,1,1-modell utan konstant MA1-koefficienten i ARIMA-modellen motsvarar Kvantitet 1- i SES-modellen Om du till exempel passar en ARIMA 0,1,1-modell utan konstant till den analyserade serien, visar den uppskattade MA 1-koefficienten sig på 0 7029, vilket är nästan exakt en minus 0 2961. Det är möjligt att lägga till antagandet om en icke-noll konstant linjär trend för en SES-modell. Ange bara en ARIMA-modell med en icke-säsongsskillnad och en MA 1-term med en konstant, dvs en ARIMA 0,1,1-modell med konstant De långsiktiga prognoserna kommer att Då har en trend som är lika med den genomsnittliga trenden som observerats under hela estimeringsperioden. Du kan inte göra detta i samband med säsongsjustering, eftersom säsongsjusteringsalternativen är inaktiverade när modelltypen är inställd på ARIMA. Du kan dock lägga till en konstant lång Termisk exponentialutveckling till en enkel exponentiell utjämningsmodell med eller utan säsongjustering genom att använda inflationsjusteringsalternativet i prognostiseringsförfarandet. Den lämpliga inflationsprocenttillväxten per period kan uppskattas som lutningskoefficienten i en linjär trendmodell monterad på data i Samband med en naturlig logaritmtransformation, eller det kan baseras på annan oberoende information om långsiktiga tillväxtutsikter. Tillbaka till början av sidan. Brett s Linjär dvs dubbel exponentiell utjämning. SMA-modellerna och SES-modellerna antar att det inte finns någon trend av Vilken typ som helst i de data som vanligtvis är ok eller åtminstone inte för dålig för 1-stegs prognoser när data är relativt noi sy och de kan modifieras för att införliva en konstant linjär trend som visad ovan. Vad sägs om kortsiktiga trender Om en serie visar en varierande tillväxthastighet eller ett cykliskt mönster som står klart mot bruset och om det finns behov av att Prognos mer än 1 år framåt, kan uppskattning av en lokal trend också vara ett problem. Den enkla exponentiella utjämningsmodellen kan generaliseras för att erhålla en linjär exponentiell utjämning av LES-modell som beräknar lokala uppskattningar av både nivå och trend. Den enklaste tidsvarierande trenden Modellen är Brown s linjär exponentiell utjämningsmodell, som använder två olika släta serier som centreras vid olika tidpunkter. Prognosformeln baseras på en extrapolering av en linje genom de två centren. En mer sofistikerad version av denna modell, Holt s, är diskuteras nedan. Den algebraiska formen av Browns linjära exponentiella utjämningsmodell, som den enkla exponentiella utjämningsmodellen, kan uttryckas i ett antal olika men e kvivalenta former Standardformen för denna modell uttrycks vanligen enligt följande. Låt S beteckna den singelglatta serien som erhållits genom att applicera enkel exponentiell utjämning till serie Y Det betyder att värdet på S vid period t ges av. Minns att under enkel exponentiell utjämning skulle detta vara prognosen för Y vid period t 1 Låt sedan S beteckna den dubbelsidiga serien som erhållits genom att applicera enkel exponentiell utjämning med samma till serie S. Slutligen är prognosen för Y tk för vilken som helst K 1, ges av. Detta ger e 1 0 dvs lurar lite och låt den första prognosen motsvara den faktiska första observationen och e 2 Y 2 Y 1, varefter prognoser genereras med hjälp av ekvationen ovan. Detta ger samma monterade värden Som formel baserad på S och S om den senare startades med användning av S 1 S 1 Y 1 Denna version av modellen används på nästa sida som illustrerar en kombination av exponentiell utjämning med säsongsjustering. Helt s linjär exponentiell utjämning. s LES-modellen beräknar lokala uppskattningar av nivå och trend genom att utjämna de senaste uppgifterna, men det faktum att det gör det med en enda utjämningsparameter ställer en begränsning på datamönstren att den kan passa nivån och trenden får inte variera vid oberoende priser Holt s LES-modellen tar upp problemet genom att inkludera två utjämningskonstanter, en för nivån och en för trenden. När som helst t, som i Brown s-modellen, finns det en uppskattning L t på lokal nivå och en uppskattning T T av den lokala trenden Här beräknas de rekursivt från värdet av Y observerat vid tid t och de tidigare uppskattningarna av nivån och trenden med två ekvationer som tillämpar exponentiell utjämning åt dem separat. Om den beräknade nivån och trenden vid tiden t-1 är L tl och T t-1, varför prognosen för Y t som skulle ha gjorts vid tid t-1 är lika med L t-1 T t-1 När det verkliga värdet observeras, uppdateras uppskattningen av nivån beräknas rekursivt genom att interpolera mellan Yt och dess prognos L t-1 T t 1 med vikter av och 1. Förändringen i beräknad nivå, nämligen L t L t 1 kan tolkas som en bullrig mätning av Trenden vid tiden t Den uppdaterade uppskattningen av trenden beräknas därefter rekursivt genom interpolering mellan L t L t 1 och den tidigare uppskattningen av trenden, T t-1 med vikter av och 1.Tolkningen av trendutjämningskonstanten är analog med den för jämnliknande konstanten Modeller med små värden antar att trenden förändras bara mycket långsamt över tiden medan modeller med större antar att det förändras snabbare En modell med en stor tror att den avlägsna framtiden är mycket osäker eftersom fel i trendberäkning blir ganska viktiga när prognoser mer än en period framöver. Av sidan. Utjämningskonstanterna och kan beräknas på vanligt sätt genom att minimera medelkvadratfelet i de 1-stegs-prognoserna. När detta görs i Statgraphics visar uppskattningarna att vara 0 3048 och 0 008 Det mycket lilla värdet av Innebär att modellen antar mycket liten förändring i trenden från en period till en annan, så i princip försöker denna modell uppskatta en långsiktig trend. I analogi med begreppet medelålder för de data som används vid uppskattning av t han lokal nivå av serien, är den genomsnittliga åldern för de data som används för att uppskatta den lokala trenden proportionell mot 1, men inte exakt lika med det i det här fallet visar sig vara 1 0 006 125 Detta är inte mycket exakt nummer Eftersom beräkningsnoggrannheten inte är riktigt 3 decimaler, men den har samma generella storleksordning som provstorleken på 100, så denna modell är medeltal över ganska mycket historia för att beräkna trenden. Prognosplotten nedan visar att LES-modellen beräknar en något större lokal trend i slutet av serien än den ständiga trenden som uppskattas i SES-trendmodellen. Det uppskattade värdet är nästan identiskt med det som erhållits genom att montera SES-modellen med eller utan trend , så det här är nästan samma modell. Nu ser dessa ut som rimliga prognoser för en modell som ska beräkna en lokal trend. Om du eyeball denna plot ser det ut som om den lokala trenden har vänt sig nedåt i slutet av Serie Wh Vid har hänt Parametrarna för denna modell har uppskattats genom att minimera kvadreringsfelet i 1-stegs prognoser, inte längre prognoser, i vilket fall trenden gör inte stor skillnad. Om allt du tittar på är 1 - steg framåtfel, ser du inte den större bilden av trender över säga 10 eller 20 perioder För att få denna modell mer i linje med vår ögonbolls extrapolering av data kan vi manuellt justera trendutjämningskonstanten så att den Använder en kortare baslinje för trenduppskattning. Om vi ​​exempelvis väljer att ställa in 0 1, är medelåldern för de data som används för att uppskatta den lokala trenden 10 perioder, vilket betyder att vi medeltar trenden under de senaste 20 perioderna eller så Här är vad prognosplottet ser ut om vi ställer in 0 1 samtidigt som vi håller 0 3 Det ser intuitivt rimligt ut för den här serien, även om det är troligt farligt att extrapolera denna trend mer än 10 perioder i framtiden. Vad med felstatistik Här är En modell jämförelse f eller de två modellerna som visas ovan samt tre SES-modeller Det optimala värdet på SES-modellen är ungefär 0 3, men liknande resultat med något mer eller mindre responsivitet erhålls med 0 5 och 0 2. En Holt s linjär expo-utjämning Med alfa 0 3048 och beta 0 008. B Holt s linjär expjäkning med alfa 0 3 och beta 0 1. C Enkel exponentiell utjämning med alfa 0 5. D Enkel exponentiell utjämning med alfa 0 3. E Enkel exponentiell utjämning med alfa 0 2.De statistiken är nästan identiska, så vi kan verkligen inte göra valet på grundval av prognosfel i ett steg i dataprovet. Vi måste falla tillbaka på andra överväganden. Om vi ​​starkt tror att det är vettigt att basera strömmen trendberäkning om vad som hänt under de senaste 20 perioderna eller så kan vi göra ett fall för LES-modellen med 0 3 och 0 1 Om vi ​​vill vara agnostiska om det finns en lokal trend, kan en av SES-modellerna Vara lättare att förklara och skulle också ge mer medel e-of-the-road prognoser för de kommande 5 eller 10 perioderna Gå tillbaka till toppen av sidan. Vilken typ av trend-extrapolation är bäst horisontellt eller linjärt. Empiriska bevis tyder på att om uppgifterna redan har justerats om det behövs för inflationen, då Det kan vara oskäligt att extrapolera kortsiktiga linjära trender långt in i framtiden. Trenden som uppenbaras idag kan slakta i framtiden på grund av olika orsaker som produktförstöring, ökad konkurrens och konjunkturnedgångar eller uppgångar i en bransch. Därför är det enkelt exponentiellt Utjämning utförs ofta bättre utom provet än vad som annars skulle kunna förväntas trots sin naiva horisontella trend-extrapolering. Dämpade trendändringar av den linjära exponentiella utjämningsmodellen används också i praktiken för att införa en konservatismedel i dess trendprognoser. Den dämpade trenden LES-modellen kan implementeras som ett speciellt fall av en ARIMA-modell, i synnerhet en ARIMA 1,1,2-modell. Det är möjligt att beräkna konfidensintervall arou Nd långsiktiga prognoser som produceras av exponentiella utjämningsmodeller, genom att betrakta dem som speciella fall av ARIMA-modeller Var försiktig att inte alla mjukvaror beräknar konfidensintervaller för dessa modeller korrekt. Bredden på konfidensintervallet beror på jag RMS-felet i modellen, ii typen Av utjämning enkel eller linjär iii värdet s av utjämningskonstanten s och iv antalet framåtprognoser du prognoserar Generellt sprids intervallerna snabbare och blir större i SES-modellen och de sprider sig mycket snabbare när linjär snarare än enkel Utjämning används Detta avsnitt diskuteras vidare i avsnittet ARIMA-modeller i anteckningarna. Gå tillbaka till början av sidan. Rösta medelvärden. Om denna information är plottad på ett diagram ser det ut så här. Detta visar att det finns en stor variation i numret Av besökare beroende på säsong Det finns mycket mindre på hösten och vintern än våren och sommaren. Men om vi ville se en trend i antalet besökare kunde vi beräkna en 4-p Oint moving average. We gör det genom att hitta det genomsnittliga antalet besökare under de fyra kvartalen 2005. Sedan hittar vi det genomsnittliga antalet besökare under de senaste tre kvartalen 2005 och första kvartalet 2006. Sedan de sista två kvartalen 2005 och De första två kvartalen 2006. Notera att det sista genomsnittet vi kan hitta är för de två sista kvartalen 2006 och de första två kvartalen 2007. Vi kartlägger de rörliga medeltalen på ett diagram och ser till att varje genomsnitt är ritat i mitten Av de fyra kvartalen det täcker. Vi kan nu se att det finns en mycket liten nedåtgående trend hos besökare.

No comments:

Post a Comment