Wednesday, 25 October 2017

A simple glidande medelvärde modell är på lämpligt used för trend prognostisering


OR-Notes är en serie inledande anteckningar om ämnen som faller under den breda rubriken inom forskningsverksamhetsområdet (OR). De användes ursprungligen av mig i en introduktionskurs eller kurs jag ger vid Imperial College. De är nu tillgängliga för användning av studenter och lärare som är intresserade av ELLER med förbehåll för följande villkor. En fullständig lista över ämnena som finns i OR-Notes finns här. Prognos Inledning Prognos är uppskattningen av värdet av en variabel (eller uppsättning variabler) vid en viss framtida tidpunkt. I den här noten kommer vi att överväga vissa metoder för prognoser. En prognosövning utförs vanligtvis för att ge stöd till beslutsfattandet och planera framtiden. Vanligtvis arbetar alla sådana övningar utifrån förutsättningen att om vi kan förutsäga hur framtiden kommer att bli kan vi ändra vårt beteende nu för att vara i en bättre position än vad vi annars skulle ha varit när framtiden anländer. Ansökningar om prognoser omfattar: inventariekontrollplanering - prognoser efterfrågan på en produkt gör det möjligt för oss att kontrollera lager av råvaror och färdiga varor, planera produktionsschemat, etc. investeringspolitik - prognoser för finansiell information såsom räntor, valutakurser, aktiekurser , priset på guld osv. Det här är ett område där ingen har utvecklat en tillförlitlig (konsekvent noggrann) prognosteknik (eller åtminstone om de inte har sagt dem någon) ekonomisk politik - prognoser för ekonomisk information som tillväxten i ekonomin, arbetslösheten, inflationen osv är avgörande för både regeringen och näringslivet när det gäller framtidsplanering. Tänk på ett ögonblick, antar att godfen kom fram för dig och berättade att på grund av din vänlighet, dygd och kyskhet (det är en saga) hade de bestämt dig för att ge dig tre prognoser. Vilka tre saker i ditt personliga affärsliv skulle du helst vilja förutse Personligen skulle jag välja (i minskar viktordning): datumet för min död de vinnande numren på nästa brittiska nationella lotteri de vinnande numren på det brittiska nationella lotteriet efter det där Som du kan se från min lista har vissa prognoser livs - eller dödseffekter. Det är också klart att för att göra vissa prognoser, t. ex. Dagen för min död kunde vi (i avsaknad av godfen att hjälpa oss) samla in några uppgifter för att möjliggöra en mer informerad och därmed förhoppningsvis mer exakt, prognos som ska göras. Till exempel kan vi titta på livslängden för medelålders brittiska manliga akademiker (icke-rökare, dricker, aldrig övningar). Vi kan också göra medicinska tester. Poängen att betona här är att insamling av relevanta data kan leda till en bättre prognos. Självklart kan det inte, jag kunde ha körts över med en bil dagen efter det här skrivet och därmed vara död redan. I själva verket på personligt sätt tror jag (nej prognos) att företag som erbjuder web (digital) odödlighet kommer att vara ett stort företagstillväxtområde i början av 21-talet. Kom ihåg att du såg det här först Typer av prognosproblem Ett sätt att klassificera prognostiseringsproblem är att överväga tidsplanen som är inblandad i prognosen, dvs hur långt framåt i framtiden vi försöker prognostisera. Kort, medellång och lång sikt är de vanliga kategorierna men den faktiska innebörden av varje kommer att variera beroende på situationen som studeras, t. ex. i prognostiserad energibehov för att bygga kraftverk 5-10 år skulle vara kortsiktiga och 50 år skulle vara långsiktiga, medan det i prognoser för konsumenternas efterfrågan i många affärssituationer upp till 6 månader skulle vara kort och över ett par år på lång sikt. Tabellen nedan visar tidsplanen i samband med affärsbeslut. Den grundläggande orsaken till ovanstående klassificering är att olika prognosmetoder gäller i varje situation, t. ex. en prognostiseringsmetod som är lämplig för prognostisering av försäljningen nästa månad (en kortsiktig prognos) skulle förmodligen vara en olämplig metod för att förutse försäljningen om fem år (en långsiktig prognos). Notera här särskilt att användningen av siffror (data) som kvantitativa tekniker tillämpas på, varierar vanligtvis från mycket höga till kortsiktiga prognoser till mycket låga för långsiktig prognos när vi hanterar affärssituationer. Prognosmetoder kan klassificeras i flera olika kategorier: kvalitativa metoder - där det inte finns någon formell matematisk modell, ofta eftersom de tillgängliga uppgifterna inte anses vara representativa för framtida (långsiktig prognos) regressionsmetoder - en förlängning av linjär regression där en variabel antas vara linjärt relaterad till ett antal andra oberoende variabler multipla ekvation metoder - där det finns ett antal beroende variabler som interagerar med varandra genom en serie ekvationer (som i ekonomiska modeller) tidsserie metoder - där vi har en enda variabel som ändras med tiden och vars framtida värden är relaterade på något sätt till dess tidigare värden. Vi kommer att överväga var och en av dessa metoder i sin tur. Kvalitativa metoder Metoder av denna typ används främst i situationer där det bedöms vara inga relevanta tidigare data (siffror) som en prognos kan baseras på och typiskt avser långsiktig prognos. Ett sådant tillvägagångssätt är Delphi-tekniken. De antika grekerna hade en mycket logisk inställning till prognoser och trodde att de bästa människorna att fråga om framtiden var övernaturliga varelser, gudar. Vid orakeln i Delphi i det antika Grekland besvarades gudarnas frågor genom en kvinna över femtio som levde bortsett från sin man och klädde sig i en klädsel för tjejer. Om du ville ha svarat på din fråga var du tvungen att: ge lite tårta ge ett djur för att offra och bada med mediet på en vår. Efter detta skulle mediet sitta på ett stativ i ett källarrum i templet, tugga laurelblad och svara på din fråga (ofta i tvetydig vers). Det är därför legitimt att fråga om i en djup i ett källarrum någonstans finns det en laurellbladstuggande statstjänsteman som är anställd för att förutse ekonomisk tillväxt, valmöjlighet etc. Kanske finns det Reflect ett ögonblick, tror du att Att göra prognoser på sätt som används vid Delphi leder till noggranna prognoser eller inte. Ny vetenskaplig undersökning (New Scientist, 1 september 2001) indikerar att mediet kan ha blivit quothighquot som ett resultat av att inhalera kolvätegaser, speciellt eten, som härrör från ett geologiskt fel under templet. Numera har Delphi-tekniken en annan betydelse. Det handlar om att fråga en expertgrupp om att komma fram till en samtycke om vad framtiden innehar. Underliggande tanken att använda experter är tron ​​att deras framtidsutsikter blir bättre än hos icke-experter (som personer som slumpmässigt valts på gatan). Tänk på - vilka typer av experter skulle du välja om du försökte prognostisera hur världen kommer att bli som på 50 års tid I ​​en Delphi-studie är experterna alla samråda separat för att undvika några av de bias som kan uppstå om de alla kom samman, t. ex dominans av en stark viljad individ, divergerande (men giltiga) åsikter som inte uttrycks av rädsla för förnedring. En typisk fråga kan vara vilket år (om någonsin) förväntar dig att automatiserad snabb transitering har blivit vanligt i större städer i Europequot. Svaren samlas i form av en fördelning av år, med bifogade kommentarer och recirkulerade för att ge reviderade uppskattningar. Denna process upprepas tills en konsensusvy uppträder. En sådan metod har vanligtvis många brister, men å andra sidan finns det ett bättre sätt att få fram framtiden om vi saknar relevanta uppgifter (siffror) som skulle behövas om vi skulle tillämpa några av de mer kvantitativa teknikerna som en Ett exempel på detta var en Delphi-studie publicerad i Science Journal i oktober 1967 som försökte se fram emot framtiden (nu är vi naturligtvis många år tidigare 1967 så vi kan se hur bra de förutspår). Många frågor ställdes om när något skulle hända och ett urval av dessa frågor ges nedan. För varje fråga ger vi det övre kvartilsvaret, den tid då 75 av experterna trodde att något skulle ha hänt. Automatiserad snabb transitering, övre kvartil svar 1985, dvs 75 av de experter som frågades år 1967 trodde att 1985 skulle vara utbredd automatiserad snabb transitering i de flesta urbana områden, berätta för alla som bor i London Utbredd användning av sofistikerade undervisningsmaskiner, övre kvartil svara 1990, dvs. 75 av de experter som frågades 1967 trodde att 1990 skulle vara utbredd användning av sofistikerade undervisningsmaskiner, berätta för alla som arbetar i en brittisk skoluniversitet Utbredd användning av robottjänster, övre kvartil svar 1995, dvs. 75 av experter frågade 1967 trodde att det skulle finnas en bred användning av robottjänster år 1995 Det är uppenbart att dessa prognoser i alla fall var mycket felaktiga. Faktum är att man ser över hela uppsatsen prognoser och många av de 25 prognoser som gjordes (om alla aspekter av livssamhet i framtiden efter 1967) var vildt felaktiga. Detta leder oss till vår första nyckelpunkt, vi är intresserade av skillnaden mellan den ursprungliga prognosen och det slutliga resultatet, dvs i prognosfel. Men tillbaka i 1967 när den här Delphi-studien gjordes, vilken annan alternativ metod hade vi om vi ville svara på dessa frågor? I många avseenden är det fråga om prognos som är avgörande, inte huruvida en viss metod ger bra (noggranna) prognoser men huruvida det är den bästa tillgängliga metoden - om det är då vilket val vi har om att använda det här. Detta ger oss den andra nyckelfunktionen, vi måste använda den mest lämpliga (bästa) prognosmetoden, även om vi vet att (historiskt ) det ger inte exakta prognoser. Regressionsmetoder Du har nog redan uppfyllt linjär regression där en rak linje i formen Y a bX är anpassad till data. Det är möjligt att förlänga metoden för att hantera mer än en oberoende variabel X. Antag att vi har k oberoende variabler X 1. X 2. X k då kan vi passa regressionslinjen Denna förlängning till den grundläggande linjära regressionstekniken är känd som multipel regression. Genom att bara känna till regressionslinjen kan vi förutse Y-givna värden för X i i1,2. k. Multipla ekvationsmetoder Metoder av denna typ används ofta i ekonomisk modellering (ekonometri) där det finns många beroende variabler som interagerar med varandra via en serie ekvationer, vars form ges av ekonomisk teori. Detta är en viktig punkt. Ekonomisk teori ger oss en inblick i de grundläggande strukturella relationerna mellan variabler. Det exakta numeriska förhållandet mellan variabler måste ofta härledas genom att undersöka data. Som exempel kan du se följande enkla modell, låt: X personlig inkomst Y personlig utgifter Jag personlig investering r ränta Från ekonomisk teori antar vi att vi har och balanseringsekvationen Här har vi 3 ekvationer i 4 variabler (X, Y, I, r ) och så att lösa dessa ekvationer måste en av variablerna ges ett värde. Den valda variabeln är känd som en exogen variabel eftersom dess värde bestäms utanför systemet med ekvationer medan de återstående variablerna kallas endogena variabler, eftersom deras värden bestäms inom ekvationssystemet, t. ex. I vår modell kan vi betrakta räntan r som exogen variabel och vara intresserad av hur X, Y och jag ändras när vi ändrar r. Vanligtvis är konstanterna a 1, a 2, b 1, b 2 inte kända exakt och måste uppskattas från data (ett komplext förfarande). Observera också att dessa konstanter sannolikt kommer att vara olika för olika grupper av människor, t. ex. urbanrural, menwomen, singlemarried, etc. Ett exempel på en ekonometrisk modell av denna typ är den brittiska statskassemodellen av ekonomin som innehåller många variabler (var och en med tidsavskrift), komplicerade ekvationer och används för att se på effekten av intresse ränteförändringar, skattereduktioner, oljeprisrörelser etc. Till exempel den brittiska statsobligationen New Scientist den 31 oktober 1993 för att förutsäga konsumtionsutgifterna ser ut som: t tidsperiod (kvartal) ifråga D förändring i variabel mellan kvartalet och sista kvartalet C konsumenternas varaktiga utgifter för kvartalet i fråga U arbetslöshet Y real disponibel inkomst justerad för inflationstab på finansiella tillgångar P inflation index för totala konsumentutgifter NFW netto finansiella tillgångar i den personliga sektorn GPW brutto fysisk välstånd i den personliga sektorn Om du klickar här hittar du en modell som låter dig spela med den brittiska ekonomin. Historiskt sett har ekonometriska techniquesmethods stora prognosfel när man förutser de nationella ekonomierna på medellång sikt. Men återkalla en av våra viktigaste punkter ovan: Vi måste använda den mest lämpliga (bästa) prognosmetoden, även om vi vet att det (historiskt) inte ger korrekta prognoser. Det kan hävdas att sådana tekniker är det mest lämpliga sättet att göra ekonomiska prognoser. Metod av denna typ avser en variabel som ändras med tiden och som kan sägas bero endast på den aktuella tiden och de tidigare värden som den tog (det vill säga inte beroende av några andra variabler eller externa faktorer). Om Y t är värdet av variabeln vid tiden t är ekvationen för Y t dvs värdet av variabeln vid tiden t är enbart en funktion av dess tidigare värden och tid, inga andra variablerfaktorer är av relevans. Syftet med tidsserieanalys är att upptäcka funktionen f och därigenom tillåta oss att prognosa värden för Y t. Tidsseriemetoder är särskilt bra för kortsiktiga prognoser, där det förflutna beteendet hos en viss variabel är en bra indikator på dess framtida beteende, åtminstone på kort sikt. Det typiska exemplet här är kortsiktig efterfrågan prognos. Observera skillnaden mellan efterfrågan och försäljningen - efterfrågan är vad kunderna vill - försäljningen är vad vi säljer, och de två kan vara olika. I grafiska termer är ytan mot Y t mot t som visas nedan. Syftet med analysen är att urskilja en viss relation mellan de hittills noterade Y-värdena för att vi ska kunna förutse framtida Y-t-värden. Vi ska behandla två tekniker för tidsserieanalys i detalj och kortfattat nämna en mer sofistikerad metod. Flyttande medel En, mycket enkel, metod för prognoser av tidsserier är att ta ett glidande medelvärde (även kallat vägat glidande medelvärde). Det rörliga genomsnittet (m t) under de sista L-perioder som slutar i period t beräknas genom att medeltalet av värdena för perioderna t-L1, t-L2, t-L3 tas med. t-1, t så att För att prognostisera med det rörliga genomsnittsvärdet säger vi att prognosen för alla perioder bortom t är bara mt (även om vi vanligtvis bara förutspår en period framåt, uppdaterar det rörliga genomsnittet som den faktiska observationen för den perioden blir tillgänglig ). Tänk på följande exempel: efterfrågan på en produkt i 6 månader visas nedan - beräkna tre månaders glidande medelvärde för varje månad och prognostisera efterfrågan på månad 7. Nu kan vi inte beräkna ett tre månaders glidande medel tills vi har minst tre iakttagelser - det är bara möjligt att beräkna ett sådant genomsnitt från månad 3 framåt. Det glidande medelvärdet för månad 3 ges av: m 3 (42 41 43) 3 42 och glidande medelvärdet för de andra månaderna ges av: Vi använder m 6 som prognosen för månad 7. Följaktligen är efterfrågesprognosen för månad 7 3670 enheter. Paketinmatningen för detta problem visas nedan. Utgången från paketet för tre månaders glidande medelvärde visas nedan. Välja mellan prognoser Ett problem med denna prognos är enkelt - hur bra är det till exempel vi kunde också producera en efterfrågan prognos för månad 7 med ett två månaders glidande medelvärde. Detta skulle ge följande: Skulle denna prognos (m 6 3600 enheter) vara bättre än vår nuvarande efterfrågan på 3670 enheter I stället för att försöka gissa vilken prognos som är bättre kan vi logiskt närma oss problemet. Faktum är att vi redan har tillräcklig information för att göra ett logiskt val mellan prognoserna om vi ser lämpligt på den informationen. I ett försök att bestämma hur bra en prognos är har vi följande logik. Tänk på tre månaders glidande medelvärde som anges ovan och låtsas ett ögonblick att vi bara krävde data för de första tre månaderna, då skulle vi beräkna det glidande genomsnittet för månad 3 (m 3) som 42 (se ovan). Detta skulle vara vår prognos för månad 4. Men i månad 4 är resultatet faktiskt 38, så vi har en skillnad (fel) definierad av: Notera här att vi kan lika väl definiera fel som resultatprognos. Det skulle bara ändra tecknet på felen, inte deras absoluta värden. Observera faktiskt här att om du inspekterar paketutmatningen ser du att det bara gör det. I månad 4 har vi en prognos för månad 5 av m 4 40,7 men ett resultat för månad 5 av 35 vilket leder till ett fel på 40,7-35 5,7. I månad 5 har vi en prognos för månad 6 av m 5 38,7 men ett resultat för månad 6 av 37 vilket leder till ett fel på 38,7-37 1,7. Därför kan vi konstruera tabellen nedan: Konstruera samma tabell för två månaders glidande medelvärde har vi: Jämförande av dessa två tabeller kan vi se att felvillkoren ger oss ett mått på hur bra prognosmetoderna (två eller tre månaders glidande medelvärde) skulle ha varit hade vi använt dem för att förutse en period (månad) framåt på de historiska data som vi har. I en ideal värld vi skulle vilja ha en prognosmetod för vilken alla fel är noll, skulle detta ge oss förtroende (förmodligen mycket förtroende) att vår prognos för månad 7 sannolikt kommer att vara korrekt. Klart, i den verkliga världen, är det osannolikt att vi får en situation där alla fel är noll. Det är verkligen svårt att titta på (som i det här fallet) två serier av felvillkor och jämföra dem. Det är mycket lättare om vi tar en del av felvillkoren, dvs reducerar varje serie till ett enda (lätt greppat) nummer. En lämplig funktion för att bestämma hur exakt en prognostiseringsmetod har varit: Logiken här är att med kvadratfel tar vi bort tecknet (eller -) och diskriminerar stora fel (avgår till små fel men är negativa för stora fel). Helst bör det genomsnittliga kvadratfelet vara noll (dvs en perfekt prognos). I alla fall föredrar vi prognosmetoden som ger det lägsta genomsnittliga kvadratfelet. Vi har det för tre månaders glidande medelvärdet: genomsnittligt kvadratfel 4sup2 5,7sup2 1,7sup23 17,13 och för två månaders glidande medelvärde: genomsnittligt kvadratfel (-1,5) sup2 4sup2 5,5sup2 (-0,5) sup24 12,19 Den lägre av dessa två siffror är förknippad med två månaders glidande medelvärde och så föredrar vi den prognostiseringsmetoden (och därmed föredrar prognosen på 3600 för månad 7 som produceras av två månaders glidande medelvärde). Medelkvadratfelet är tekniskt känt som den genomsnittliga kvadrerade avvikelsen (MSD) eller medelkvadratfelet (MSE). Notera här att vi faktiskt har gjort mer än att skilja mellan två olika prognoser (dvs mellan två månader och tre månaders glidande medelvärde). Vi har nu ett kriterium för att skilja mellan prognoser, men de genereras - det vill säga att vi föredrar prognosen som genereras av tekniken med lägsta MSD (historiskt sett var den mest exakta prognostekniken på dataen vi tillämpat det konsekvent över tiden). Detta är viktigt eftersom vi vet att även vårt enkla paket innehåller många olika metoder för prognoser av tidsserier - som nedan. Fråga - tror du att en av de ovannämnda prognosmetoderna alltid ger bättre resultat än de andra eller inte? En exponentiell utjämning En nackdel med att använda glidande medelvärden för prognoser är att vid beräkning av medelvärdet får alla observationer samma vikt (nämligen 1L), medan vi förväntar oss att de senaste observationerna skulle bli en bättre indikator på framtiden (och därför borde ges större vikt). Också i glidande medelvärden använder vi endast senaste observationer, kanske vi bör ta hänsyn till alla tidigare observationer. En teknik som kallas exponentiell utjämning (eller, mer exakt, enkel exponentiell utjämning) ger större vikt till senare observationer och tar hänsyn till alla tidigare observationer. Definiera en konstant mikro där 0 lt micro lt 1 då (exponentially smoothed moving average) för period t (M t say) ges av Så att du kan se här att det exponentiellt jämnade glidande medlet tar hänsyn till alla tidigare observationer, jämföra det glidande medelvärdet ovan där endast några få av de föregående observationerna beaktades. Ovannämnda ekvation är svår att använda numeriskt men notera att: Det exponentiellt jämnade glidande mediet för period t är en linjär kombination av strömvärdet (Yt) och det tidigare exponentiellt glattade glidande medlet (M t-1). Den konstanta mikro kallas utjämningskonstanten och värdet av mikro återspeglar vikten som givits till den aktuella observationen (Y t) vid beräkning av exponentiellt glatt rörligt medelvärde M t för period t (vilket är prognosen för period t1). Till exempel om mikro 0,2 då indikerar detta att 20 av vikten i generande prognoser tilldelas den senaste observationen och de återstående 80 till föregående observationerna. Observera att M t-mikro t (1 mikro) M t-1 också kan skrivas M t M t-1 - mikro (M t-1 - Y t) eller aktuell prognos tidigare prognos - mikro (fel i tidigare prognos) så exponentiell utjämning kan ses som en prognos som kontinuerligt uppdateras av det prognosfel som just gjorts. Tänk på följande exempel: för de efterfrågadata som anges i föregående avsnitt beräkna det exponentiellt jämnaste glidande medlet för värden på utjämningskonstanten mikro 0,2 och 0,9. Vi har följande för mikro 0.2. Observera här att det vanligtvis är tillräckligt att bara arbeta till två eller tre decimaler när exponentiell utjämning görs. Vi använder M 6 som prognosen för månad 7, dvs prognosen för månad 7 är 3938 enheter. Vi har följande för mikro 0,9. Som tidigare är M 6 prognosen för månad 7, dvs 3684 enheter. Paketutmatningen för micro0.2 visas nedan. Paketutmatningen för micro0.9 visas nedan. För att bestämma det bästa värdet av mikro (från de två värdena på 0,2 och 0,9 som beaktas) väljer vi värdet associerat med lägsta MSD (som ovan för glidande medelvärden). För micro0.2 har vi MSD (42-41) sup2 (41,80-43) sup2 (42,04-38) sup2 (41,23-35) sup2 (39,98-37) sup25 13,29 För mikro0,9 har vi den MSD (42- 41) sup2 (41,10-43) sup2 (42,81-38) sup2 (38,48-35) sup2 (35,35-37) sup25 8,52 Observera härmed att dessa MSD-värden överensstämmer (inom avrundningsfel) med de MSD-värden som anges i paketutgången ovan. I detta fall tycks mikro0.9 ge bättre prognoser än micro0.2 eftersom det har ett mindre värde av MSD. Ovan använde vi MSD för att reducera en rad felvillkor till ett enkelt greppat singeltal. Faktum är att andra funktioner än MSD, såsom MAD (genomsnittlig avvikelse) medelfel bias (medelfel) medelfel, också vet som kumulativ prognosfel existerar, som också kan användas för att reducera en serie av felvillkor till ett enda nummer så att att bedöma hur bra en prognos är. Förpackningen ger till exempel ett antal sådana funktioner, som definieras som: I själva verket finns metoder som möjliggör det optimala värdet av utjämningskonstanten (dvs värdet av mikro som minimerar de valda kriterierna av prognosnoggrannheten, såsom genomsnittlig kvadratisk avvikelse (MSD)) för att enkelt kunna bestämmas. Detta kan ses nedan där paketet har beräknat att värdet på mikro som minimerar MSD är micro0.86 (ungefärligt). Notera här att paketet kan användas för att plotta både data och prognoserna som genereras av den valda metoden. Nedan visar vi detta för utgången ovan (associerad med värdet av mikro som minimerar MSD på 0,86. Notera här att valet av kriterium kan ha stor effekt på värdet av mikro, t. ex. för vårt exempel värdet av mikro som minimerar MAD är micro0.59 (approximativt) och värdet av mikro som minimerar bias är micro1.0 (approximativt). För att illustrera förändringen i MAD, bias och MSD som mikroförändringar, graver vi under MAD och bias mot utjämningskonstanten mikro och under MSD mot mikro. Nedan grafiseras värdet av prognosen mot mikro. En särskild punkt är att för ett exempel på ett relativt brett spektrum av värden för mikroprognosen är prognosen stabil (t ex 0,60 lt mikro 1,00 prognosen ligger mellan 36,75 och 37,00). Detta kan ses nedan - kurvan är quotflatquot för höga mikrovärden. Observera att ovanstående diagram innebär att man, i att hitta ett bra värde för utjämningskonstanten, inte brukar beräkna i mycket hög gradav noggrannhet (t. ex. inte till exempel inom 0,001). Mer avancerade tidsserier prognoser Tidsserier prognostiseringsmetoder mer avancerade än de som anses i vårt enkla paket existerar. Dessa baseras på A uto R egressive I ntegrated M oving A verage (ARIMA) modeller. I huvudsak antar dessa att tidsserierna har genererats med en sannolikhetsprocess med framtida värden relaterade till tidigare värden, liksom till tidigare prognosfel. För att tillämpa ARIMA-modeller måste tidsserierna vara stationära. En stationär tidsserie är en vars statistiska egenskaper som medelvärde, varians och autokorrelation är konstanta över tiden. Om den ursprungliga tidsserien inte är stationär kan det vara att någon funktion av tidsserien, t. ex. Att ta skillnaderna mellan successiva värden är stillastående. Vid inpassning av en ARIMA-modell till tidsseriedata är ramverket som vanligtvis används ett Box-Jenkins-tillvägagångssätt. Det har emellertid nackdelen att medan ett antal tidsserier tekniker är helt automatiska, i den meningen att prospekteraren inte behöver utöva någon annan bedömning än att välja tekniken att använda, kräver Box-Jenkins-tekniken att prospekten ska bedöma och Därför kräver användningen erfarenhet och quotexpert judgment of the prospector. Vissa prognospaket existerar som gör dessa quotexpert optionsquot för dig. Mer om ARIMA och Box-Jenkins finns här. här och här. Vi har bara gett en översikt över vilka typer av prognosmetoder som finns tillgängliga. Nyckeln till prognostisering idag är att förstå de olika prognosmetoderna och deras relativa fördelar och så kunna välja vilken metod som ska tillämpas i en viss situation (t ex överväga hur många prognoser för tidsserier som paketet har tillgängligt). Alla prognosmetoder involverar tråkiga repetitiva beräkningar och är så lämpade att de görs av en dator. Prognospaket, många av ett interaktivt slag (för användning på datorer) är tillgängliga för prospekteraren. Några fler prognoser kan hittas här. Introduktion till ARIMA: nonseasonal modeller ARIMA (p, d, q) prognoser ekvation: ARIMA-modeller är i teorin den vanligaste klassen av modeller för prognoser för en tidsserie som kan göras för att vara 8220stationary8221 genom differentiering (om nödvändigt), kanske i samband med olinjära transformationer, såsom loggning eller deflatering (om nödvändigt). En slumpmässig variabel som är en tidsserie är stationär om dess statistiska egenskaper är konstanta över tiden. En stationär serie har ingen trend, dess variationer kring dess medelvärde har en konstant amplitud, och det vinklar på ett konsekvent sätt. d. v.s. dess kortsiktiga slumpmässiga tidsmönster ser alltid ut i statistisk mening. Det sistnämnda tillståndet betyder att dess autokorrelationer (korrelationer med sina egna tidigare avvikelser från medelvärdet) förblir konstanta över tiden, eller likvärdigt, att dess effektspektrum förblir konstant över tiden. En slumpmässig variabel i denna blankett kan ses som en kombination av signal och brus, och signalen (om en är uppenbar) kan vara ett mönster av snabb eller långsam mean reversion eller sinusformig oscillation eller snabb växling i tecken , och det kan också ha en säsongskomponent. En ARIMA-modell kan ses som en 8220filter8221 som försöker separera signalen från bruset, och signalen extrapoleras därefter i framtiden för att få prognoser. ARIMA-prognosekvationen för en stationär tidsserie är en linjär (d. v.s. regressionstyp) ekvation där prediktorerna består av lags av de beroende variabla andorlagren av prognosfel. Det vill säga: Förutsatt värdet på Y är en konstant och en viktad summa av ett eller flera nya värden av Y och eller en vägd summa av ett eller flera nya värden av felen. Om prediktorerna endast består av fördröjda värden på Y. Det är en ren autoregressiv (8220self-regressed8221) modell, som bara är ett speciellt fall av en regressionsmodell och som kan förses med standard regressionsprogram. Exempelvis är en första-order-autoregressiv (8220AR (1) 8221) modell för Y en enkel regressionsmodell där den oberoende variabeln bara Y är försenad med en period (LAG (Y, 1) i Statgraphics eller YLAG1 i RegressIt). Om en del av prediktorerna är felaktiga, är en ARIMA-modell inte en linjär regressionsmodell eftersom det inte går att ange 8220last period8217s error8221 som en oberoende variabel: felen måste beräknas periodvis när modellen är monterad på data. Tekniskt sett är problemet med att använda fördröjda fel som prediktorer att modellen8217s förutsägelser inte är linjära funktioner för koefficienterna. även om de är linjära funktioner av tidigare data. Så koefficienter i ARIMA-modeller som innehåller fördröjda fel måste uppskattas genom olinjära optimeringsmetoder (8220hill-climbing8221) istället för att bara lösa ett system av ekvationer. Akronymet ARIMA står för Auto-Regressive Integrated Moving Average. Lags av den stationära serien i prognosen ekvationen kallas quotautoregressivequot termer, lags av prognosfel kallas quotmoving averagequot termer och en tidsserie som behöver differentieras för att göras stationär sägs vara en quotintegratedquot-version av en stationär serie. Slumpmässiga och slumpmässiga modeller, autoregressiva modeller och exponentiella utjämningsmodeller är alla speciella fall av ARIMA-modeller. En nonseasonal ARIMA-modell klassificeras som en quotARIMA (p, d, q) kvotmodell där: p är antalet autoregressiva termer, d är antalet icke-säsongsskillnader som behövs för stationaritet och q är antalet fördröjda prognosfel i prediksionsekvationen. Prognosekvationen är konstruerad enligt följande. Först, låt y beteckna d: s skillnad på Y. Det betyder: Observera att den andra skillnaden i Y (d2-fallet) inte är skillnaden från 2 perioder sedan. Det är snarare den första skillnaden-av-första skillnaden. vilken är den diskreta analogen av ett andra derivat, dvs den lokala accelerationen av serien i stället för dess lokala trend. När det gäller y. the general forecasting equation is: Here the moving average parameters ( 9528217s ) are defined so that their signs are negative in the equation, following the convention introduced by Box and Jenkins. Some authors and software (including the R programming language) define them so that they have plus signs instead. When actual numbers are plugged into the equation, there is no ambiguity, but it8217s important to know which convention your software uses when you are reading the output. Often the parameters are denoted there by AR(1), AR(2), 8230, and MA(1), MA(2), 8230 etc. To identify the appropriate ARIMA model for Y. you begin by determining the order of differencing (d) needing to stationarize the series and remove the gross features of seasonality, perhaps in conjunction with a variance-stabilizing transformation such as logging or deflating. If you stop at this point and predict that the differenced series is constant, you have merely fitted a random walk or random trend model. However, the stationarized series may still have autocorrelated errors, suggesting that some number of AR terms (p 8805 1) andor some number MA terms (q 8805 1) are also needed in the forecasting equation. The process of determining the values of p, d, and q that are best for a given time series will be discussed in later sections of the notes (whose links are at the top of this page), but a preview of some of the types of nonseasonal ARIMA models that are commonly encountered is given below. ARIMA(1,0,0) first-order autoregressive model: if the series is stationary and autocorrelated, perhaps it can be predicted as a multiple of its own previous value, plus a constant. The forecasting equation in this case is 8230which is Y regressed on itself lagged by one period. This is an 8220ARIMA(1,0,0)constant8221 model. If the mean of Y is zero, then the constant term would not be included. If the slope coefficient 981 1 is positive and less than 1 in magnitude (it must be less than 1 in magnitude if Y is stationary), the model describes mean-reverting behavior in which next period8217s value should be predicted to be 981 1 times as far away from the mean as this period8217s value. If 981 1 is negative, it predicts mean-reverting behavior with alternation of signs, i. e. it also predicts that Y will be below the mean next period if it is above the mean this period. In a second-order autoregressive model (ARIMA(2,0,0)), there would be a Y t-2 term on the right as well, and so on. Depending on the signs and magnitudes of the coefficients, an ARIMA(2,0,0) model could describe a system whose mean reversion takes place in a sinusoidally oscillating fashion, like the motion of a mass on a spring that is subjected to random shocks. ARIMA(0,1,0) random walk: If the series Y is not stationary, the simplest possible model for it is a random walk model, which can be considered as a limiting case of an AR(1) model in which the autoregressive coefficient is equal to 1, i. e. a series with infinitely slow mean reversion. The prediction equation for this model can be written as: where the constant term is the average period-to-period change (i. e. the long-term drift) in Y. This model could be fitted as a no-intercept regression model in which the first difference of Y is the dependent variable. Since it includes (only) a nonseasonal difference and a constant term, it is classified as an quotARIMA(0,1,0) model with constant. quot The random-walk - without - drift model would be an ARIMA(0,1,0) model without constant ARIMA(1,1,0) differenced first-order autoregressive model: If the errors of a random walk model are autocorrelated, perhaps the problem can be fixed by adding one lag of the dependent variable to the prediction equation--i. e. by regressing the first difference of Y on itself lagged by one period. This would yield the following prediction equation: which can be rearranged to This is a first-order autoregressive model with one order of nonseasonal differencing and a constant term--i. e. an ARIMA(1,1,0) model. ARIMA(0,1,1) without constant simple exponential smoothing: Another strategy for correcting autocorrelated errors in a random walk model is suggested by the simple exponential smoothing model. Recall that for some nonstationary time series (e. g. ones that exhibit noisy fluctuations around a slowly-varying mean), the random walk model does not perform as well as a moving average of past values. In other words, rather than taking the most recent observation as the forecast of the next observation, it is better to use an average of the last few observations in order to filter out the noise and more accurately estimate the local mean. The simple exponential smoothing model uses an exponentially weighted moving average of past values to achieve this effect. The prediction equation for the simple exponential smoothing model can be written in a number of mathematically equivalent forms. one of which is the so-called 8220error correction8221 form, in which the previous forecast is adjusted in the direction of the error it made: Because e t-1 Y t-1 - 374 t-1 by definition, this can be rewritten as: which is an ARIMA(0,1,1)-without-constant forecasting equation with 952 1 1 - 945. This means that you can fit a simple exponential smoothing by specifying it as an ARIMA(0,1,1) model without constant, and the estimated MA(1) coefficient corresponds to 1-minus-alpha in the SES formula. Recall that in the SES model, the average age of the data in the 1-period-ahead forecasts is 1 945. meaning that they will tend to lag behind trends or turning points by about 1 945 periods. It follows that the average age of the data in the 1-period-ahead forecasts of an ARIMA(0,1,1)-without-constant model is 1(1 - 952 1 ). So, for example, if 952 1 0.8, the average age is 5. As 952 1 approaches 1, the ARIMA(0,1,1)-without-constant model becomes a very-long-term moving average, and as 952 1 approaches 0 it becomes a random-walk-without-drift model. What8217s the best way to correct for autocorrelation: adding AR terms or adding MA terms In the previous two models discussed above, the problem of autocorrelated errors in a random walk model was fixed in two different ways: by adding a lagged value of the differenced series to the equation or adding a lagged value of the forecast error. Which approach is best A rule-of-thumb for this situation, which will be discussed in more detail later on, is that positive autocorrelation is usually best treated by adding an AR term to the model and negative autocorrelation is usually best treated by adding an MA term. In business and economic time series, negative autocorrelation often arises as an artifact of differencing . (In general, differencing reduces positive autocorrelation and may even cause a switch from positive to negative autocorrelation.) So, the ARIMA(0,1,1) model, in which differencing is accompanied by an MA term, is more often used than an ARIMA(1,1,0) model. ARIMA(0,1,1) with constant simple exponential smoothing with growth: By implementing the SES model as an ARIMA model, you actually gain some flexibility. First of all, the estimated MA(1) coefficient is allowed to be negative . this corresponds to a smoothing factor larger than 1 in an SES model, which is usually not allowed by the SES model-fitting procedure. Second, you have the option of including a constant term in the ARIMA model if you wish, in order to estimate an average non-zero trend. The ARIMA(0,1,1) model with constant has the prediction equation: The one-period-ahead forecasts from this model are qualitatively similar to those of the SES model, except that the trajectory of the long-term forecasts is typically a sloping line (whose slope is equal to mu) rather than a horizontal line. ARIMA(0,2,1) or (0,2,2) without constant linear exponential smoothing: Linear exponential smoothing models are ARIMA models which use two nonseasonal differences in conjunction with MA terms. The second difference of a series Y is not simply the difference between Y and itself lagged by two periods, but rather it is the first difference of the first difference --i. e. the change-in-the-change of Y at period t. Thus, the second difference of Y at period t is equal to (Y t - Y t-1 ) - (Y t-1 - Y t-2 ) Y t - 2Y t-1 Y t-2 . A second difference of a discrete function is analogous to a second derivative of a continuous function: it measures the quotaccelerationquot or quotcurvaturequot in the function at a given point in time. The ARIMA(0,2,2) model without constant predicts that the second difference of the series equals a linear function of the last two forecast errors: which can be rearranged as: where 952 1 and 952 2 are the MA(1) and MA(2) coefficients. This is a general linear exponential smoothing model . essentially the same as Holt8217s model, and Brown8217s model is a special case. It uses exponentially weighted moving averages to estimate both a local level and a local trend in the series. The long-term forecasts from this model converge to a straight line whose slope depends on the average trend observed toward the end of the series. ARIMA(1,1,2) without constant damped-trend linear exponential smoothing . This model is illustrated in the accompanying slides on ARIMA models. It extrapolates the local trend at the end of the series but flattens it out at longer forecast horizons to introduce a note of conservatism, a practice that has empirical support. See the article on quotWhy the Damped Trend worksquot by Gardner and McKenzie and the quotGolden Rulequot article by Armstrong et al. for details. It is generally advisable to stick to models in which at least one of p and q is no larger than 1, i. e. do not try to fit a model such as ARIMA(2,1,2), as this is likely to lead to overfitting and quotcommon-factorquot issues that are discussed in more detail in the notes on the mathematical structure of ARIMA models. Spreadsheet implementation: ARIMA models such as those described above are easy to implement on a spreadsheet. The prediction equation is simply a linear equation that refers to past values of original time series and past values of the errors. Thus, you can set up an ARIMA forecasting spreadsheet by storing the data in column A, the forecasting formula in column B, and the errors (data minus forecasts) in column C. The forecasting formula in a typical cell in column B would simply be a linear expression referring to values in preceding rows of columns A and C, multiplied by the appropriate AR or MA coefficients stored in cells elsewhere on the spreadsheet. Forecasting with time series analysis What is forecasting Forecasting is a method that is used extensively in time series analysis to predict a response variable, such as monthly profits, stock performance, or unemployment figures, for a specified period of time. Prognoser baseras på mönster i befintliga data. Till exempel kan en lagerchef ange hur mycket produkt som ska beställa för de kommande tre månaderna baserat på de senaste 12 månaderna av order. Du kan använda en rad olika tidsseriemetoder, såsom trendanalys, sönderdelning eller enkel exponentiell utjämning, för att modellera mönster i data och extrapolera dessa mönster till framtiden. Välj en analysmetod om mönstren är statiska (konstant över tiden) eller dynamisk (förändring över tid), typ av trend och säsongskomponenter och hur långt du vill förutse. Innan du producerar prognoser, anpassa flera kandidatmodeller till data för att bestämma vilken modell som är mest stabil och korrekt. Prognoser för en rörlig genomsnittsanalys Det monterade värdet vid tid t är det ocenterade glidande medlet vid tid t -1. Prognoserna är de monterade värdena vid prognosens ursprung. Om du förutser 10 tidsenheter framåt, kommer det prognostiserade värdet för varje gång att vara det monterade värdet vid ursprung. Uppgifterna till uppkomsten används för att beräkna de glidande medelvärdena. Du kan använda den linjära glidande medelvärdesmetoden genom att beräkna på varandra följande glidmedel. Den linjära glidande metoden används ofta när det finns en trend i data. Först beräkna och lagra det rörliga genomsnittet av originalserien. Beräkna och lagra sedan det glidande medlet för den tidigare lagrade kolumnen för att få ett andra glidande medelvärde. Vid naiv prognos är prognosen för tid t datavärdet vid tiden t -1. Med hjälp av glidande medelprocedur med ett glidande medelvärde av längd ger en naiv prognos. Prognoser för en enda exponentiell utjämningsanalys Det monterade värdet vid tid t är det jämnvärda värdet vid tid t-1. Prognoserna är det monterade värdet vid prognosens ursprung. Om du förutser 10 tidsenheter framåt, kommer det prognostiserade värdet för varje gång att vara det monterade värdet vid ursprung. Uppgifterna till uppkomsten används för utjämning. Vid naiv prognos är prognosen för tid t datavärdet vid tid t-1. Utför enkel exponentiell utjämning med en vikt av en för att göra naiv prognos. Prognoser för en dubbel exponentiell utjämningsanalys Dubbel exponentiell utjämning använder nivå - och trendkomponenterna för att generera prognoser. Prognosen för m perioder framåt från en punkt till tiden t är L t mT t. där L t är nivån och T t är trenden vid tiden t. Uppgifterna upp till prognostiserad ursprungstid kommer att användas för utjämning. Prognoser för Winters metod Winters metod använder nivå, trend och säsongskomponenter för att generera prognoser. Prognosen för m perioder framåt från en punkt till tiden t är: där L t är nivån och T t är trenden vid tid t multiplicerad med (eller tillsatt för en additivmodell) säsongskomponenten för samma period från förra året. Winters Method använder data upp till prognosens ursprungstid för att generera prognoserna.

No comments:

Post a Comment