Friday, October 21, 2016

5 Tydperk Gesentreer Bewegende Gemiddelde

Wanneer die berekening van 'n lopende bewegende gemiddelde, die plasing van die gemiddelde in die middel tydperk sinvol In die vorige voorbeeld het ons bereken die gemiddeld van die eerste 3 tydperke en sit dit langs tydperk 3. Ons kan die gemiddelde geplaas in die middel van die tyd interval van drie tydperke, dit is, langs tydperk 2. dit werk goed met vreemde tydperke, maar nie so goed vir selfs tydperke. So waar sou ons plaas die eerste bewegende gemiddelde wanneer M 4 Tegnies, sou die bewegende gemiddelde op t 2.5, 3.5 val. Om hierdie probleem wat ons glad Mas using 2. So glad ons die stryk waardes As ons gemiddeld 'n gelyke getal terme te vermy, moet ons die stryk waardes glad Die volgende tabel toon die resultate met behulp van M 4.Moving Gemiddeldes: Wat is dit Een van die mees gewilde tegniese aanwysers, is bewegende gemiddeldes gebruik om die rigting van die huidige tendens meet. Elke tipe bewegende gemiddelde (algemeen in hierdie handleiding as MA geskryf) is 'n wiskundige gevolg dat word bereken deur die gemiddeld van 'n aantal van die verlede datapunte. Sodra bepaal, die gevolglike gemiddelde is dan geplot op 'n grafiek, sodat die handelaars om te kyk na reëlmatige data eerder as om te fokus op die dag-tot-dag prysskommelings wat inherent in alle finansiële markte is. Die eenvoudigste vorm van 'n bewegende gemiddelde, gepas bekend as 'n eenvoudige bewegende gemiddelde (SMA), word bereken deur die rekenkundige gemiddelde van 'n gegewe stel waardes. Byvoorbeeld, 'n basiese 10-dae - bewegende gemiddelde wat jy wil voeg tot die sluiting pryse van die afgelope 10 dae en dan verdeel die gevolg van 10. In Figuur 1 te bereken, die som van die pryse vir die afgelope 10 dae (110) is gedeel deur die aantal dae (10) om te kom op die 10-dae gemiddelde. As 'n handelaar wil graag 'n 50-dag gemiddelde sien in plaas daarvan, sal dieselfde tipe berekening gemaak word, maar dit sal die pryse sluit oor die afgelope 50 dae. Die gevolglike gemiddelde hieronder (11) in ag neem die afgelope 10 datapunte om handelaars 'n idee van hoe 'n bate relatiewe is geprys om die afgelope 10 dae te gee. Miskien is jy wonder hoekom tegniese handelaars noem hierdie hulpmiddel 'n bewegende gemiddelde en nie net 'n gewone gemiddelde. Die antwoord is dat as nuwe waardes beskikbaar is, moet die oudste datapunte laat val van die stel en nuwe data punte moet kom om dit te vervang. So, is die datastel voortdurend in beweging om rekenskap te gee nuwe data soos dit beskikbaar raak. Hierdie metode van berekening verseker dat slegs die huidige inligting word verreken. In Figuur 2, sodra die nuwe waarde van 5 word by die stel, die rooi boks (wat die afgelope 10 datapunte) na regs beweeg en die laaste waarde van 15 laat val van die berekening. Omdat die relatief klein waarde van 5 die hoë waarde van 15 vervang, sou jy verwag om die gemiddeld van die datastel afname, wat dit nie sien nie, in hierdie geval van 11 tot 10. Wat Moet Bewegende Gemiddeldes lyk as die waardes van die MA is bereken, hulle geplot op 'n grafiek en dan gekoppel aan 'n bewegende gemiddelde lyn te skep. Hierdie buig lyne is algemeen op die kaarte van tegniese handelaars, maar hoe dit gebruik word kan drasties wissel (meer hieroor later). Soos jy kan sien in Figuur 3, is dit moontlik om meer as een bewegende gemiddelde om enige term voeg deur die aanpassing van die aantal tydperke gebruik word in die berekening. Hierdie buig lyne kan steurende of verwarrend lyk op die eerste, maar jy sal groei gewoond aan hulle soos die tyd gaan aan. Die rooi lyn is eenvoudig die gemiddelde prys oor die afgelope 50 dae, terwyl die blou lyn is die gemiddelde prys oor die afgelope 100 dae. Nou dat jy verstaan ​​wat 'n bewegende gemiddelde is en hoe dit lyk, goed in te voer 'n ander tipe van bewegende gemiddelde en kyk hoe dit verskil van die voorheen genoem eenvoudig bewegende gemiddelde. Die eenvoudige bewegende gemiddelde is uiters gewild onder handelaars, maar soos alle tegniese aanwysers, dit het sy kritici. Baie individue argumenteer dat die nut van die SMA is beperk omdat elke punt in die datareeks dieselfde geweeg, ongeag waar dit voorkom in die ry. Kritici argumenteer dat die mees onlangse data is belangriker as die ouer data en moet 'n groter invloed op die finale uitslag het. In reaksie op hierdie kritiek, handelaars begin om meer gewig te gee aan onlangse data, wat sedertdien gelei tot die uitvinding van die verskillende tipes van nuwe gemiddeldes, die gewildste van wat is die eksponensiële bewegende gemiddelde (EMA). (Vir verdere inligting, sien Basics gelaaide bewegende gemiddeldes en Wat is die verskil tussen 'n SMA en 'n EMO) Eksponensiële bewegende gemiddelde Die eksponensiële bewegende gemiddelde is 'n tipe van bewegende gemiddelde wat meer gewig gee aan onlangse pryse in 'n poging om dit meer ontvanklik maak om nuwe inligting. Leer die ietwat ingewikkeld vergelyking vir die berekening van 'n EMO kan onnodige vir baie handelaars wees, aangesien byna al kartering pakkette doen die berekeninge vir jou. Maar vir jou wiskunde geeks daar buite, hier is die EMO vergelyking: By die gebruik van die formule om die eerste punt van die EMO bereken, kan jy agterkom dat daar geen waarde beskikbaar is om te gebruik as die vorige EMO. Hierdie klein probleem opgelos kan word deur die begin van die berekening van 'n eenvoudige bewegende gemiddelde en die voortsetting van die bogenoemde formule van daar af. Ons het jou voorsien van 'n monster spreadsheet wat die werklike lewe voorbeelde van hoe om beide 'n eenvoudige bewegende gemiddelde en 'n eksponensiële bewegende gemiddelde te bereken sluit. Die verskil tussen die EMO en SMA Nou dat jy 'n beter begrip van hoe die SMA en die EMO bereken word, kan 'n blik op hoe hierdie gemiddeldes verskil. Deur te kyk na die berekening van die EMO, sal jy agterkom dat meer klem gelê op die onlangse data punte, maak dit 'n soort van geweegde gemiddelde. In Figuur 5, die nommers van tydperke wat in elk gemiddeld is identies (15), maar die EMO reageer vinniger by die veranderende pryse. Let op hoe die EMO het 'n hoër waarde as die prys styg, en val vinniger as die SMA wanneer die prys daal. Dit reaksie is die hoofrede waarom so baie handelaars verkies om die EMO gebruik oor die SMA. Wat doen die verskillende dae gemiddelde bewegende gemiddeldes is 'n heeltemal aanpas aanwyser, wat beteken dat die gebruiker vrylik kan kies watter tyd raam wat hulle wil wanneer die skep van die gemiddelde. Die mees algemene tydperke wat in bewegende gemiddeldes is 15, 20, 30, 50, 100 en 200 dae. Hoe korter die tydsduur wat gebruik word om die gemiddelde te skep, hoe meer sensitief sal wees om die prys veranderinge. Hoe langer die tydsverloop, hoe minder sensitief, of meer reëlmatige, die gemiddelde sal wees. Daar is geen regte tyd raam te gebruik wanneer die opstel van jou bewegende gemiddeldes. Die beste manier om uit te vind watter een werk die beste vir jou is om te eksperimenteer met 'n aantal verskillende tydperke totdat jy die een wat jou strategie pas te vind. Bewegende gemiddeldes: Hoe om dit te gebruik Skryf Nuus om te gebruik vir die nuutste insigte en ontleding Dankie vir jou inskrywing om Investopedia insigte - Nuus om Use. Beginning in Release 6.08 van die SAS System, PROC brei in SAS / ETS sagteware kan gebruik word om 'n verskeidenheid van data transformasies. Hierdie transformasies sluit in: lei, loop, geweeg en ongeweegde bewegende gemiddeldes, beweeg somme, en kumulatiewe somme, 'n paar te noem. Baie nuwe transformasies is bygevoeg in Release 6.12, insluitend aparte spesifikasies vir gesentreer en agtertoe bewegende gemiddeldes. Hierdie nuwe transformasies het dit nodig om die sintaksis vir 'n paar van die steun voor vrystelling 6.12 transformasies verander. Voorbeelde van hoe om die sintaksis vir gesentreer en agtertoe bewegende gemiddeldes met behulp Release 6.11 spesifiseer en vroeër en Release 6.12 en later word hieronder gegee. PROC brei kan bereken óf 'n gesentreerde bewegende gemiddelde of 'n agterlike bewegende gemiddelde. 'N 5-tydperk gesentreer bewegende gemiddelde word bereken deur die gemiddeld van 'n totaal van 5 agtereenvolgende waardes van die reeks (die huidige tydperk waarde bykomend tot die twee onmiddellik voorafgaande waardes en twee waardes wat onmiddellik volg op die huidige waarde). 'N 5-tydperk agteruit bewegende gemiddelde word bereken deur die gemiddeld van die huidige tydperk waarde met die waardes van die 4 onmiddellik voorafgaande tydperke. Die volgende opdrag illustreer hoe om die Transform (MOVAVE n) spesifikasie gebruik om 'n 5-tydperk bereken gesentreer bewegende gemiddelde behulp Release 6.11 of vroeër: Om te bereken 'n N tydperk agteruit bewegende gemiddelde behulp Release 6.11 of vroeër, maak gebruik van die Transform (MOVAVE N LAG k) spesifikasie, waar k (N-1) / 2 as n onewe of waar k (N-2) / 2 As n ewe. Byvoorbeeld, die volgende sintaks illustreer hoe om 'n 5-tydperk agteruit bewegende gemiddelde bereken met behulp van Release 6.11 of vroeër: Die volgende opdrag illustreer hoe om die Transform (CMOVAVE n) spesifikasie gebruik om te bereken 'n 5-tydperk gesentreerde bewegende gemiddelde behulp Release 6.12 of later: die volgende soortgelyke sintaksis illustreer hoe om die Transform (MOVAVE n) spesifikasie gebruik om 'n 5-tydperk agteruit bewegende gemiddelde bereken met behulp van Release 6.12 of later: vir meer inligting, sien Transformasie Bedryf in die brei hoofstuk van die SAS / ETS Gebruikers Handleiding . As jy nie toegang tot SAS / ETS het, kan jy 'n bewegende gemiddelde is in die data stap bereken soos in hierdie voorbeeld program. Bedryfstelsel en gemiddeldes Release InformationMoving bewegende gemiddeldes Met konvensionele datastelle die gemiddelde waarde is dikwels die eerste, en een van die mees bruikbare, opsommingstatistiek te bereken. Wanneer data in die vorm van 'n tydreeks, die reeks beteken is 'n nuttige maatstaf, maar nie die dinamiese aard van die data weerspieël. Gemiddelde waardes bereken oor kortsluiting periodes, hetsy voor die huidige tydperk of gesentreer op die huidige tydperk, is dikwels meer nuttig. Omdat so 'n gemiddelde waardes sal wissel, of beweeg, soos die huidige tydperk beweeg van tyd t 2, t 3. ens staan ​​hulle bekend as bewegende gemiddeldes (Mas). 'N Eenvoudige bewegende gemiddelde is (tipies) die ongeweegde gemiddelde van k voor waardes. 'N eksponensieel geweeg bewegende gemiddelde is in wese dieselfde as 'n eenvoudige bewegende gemiddelde, maar met bydraes tot die gemiddelde geweegde deur hul nabyheid aan die huidige tyd. Want daar is nie een nie, maar 'n hele reeks bewegende gemiddeldes vir enige gegewe reeks, die stel van Mas kan hulself getrek word op grafieke, ontleed as 'n reeks, en gebruik in die modellering en voorspelling. 'N verskeidenheid van modelle kan gebou word met behulp van bewegende gemiddeldes, en dit is bekend as MA modelle. As sulke modelle word gekombineer met outoregressiewe (AR) modelle die gevolglike saamgestelde modelle is bekend as ARMA of ARIMA modelle (die Ek is vir geïntegreerde). Eenvoudige bewegende gemiddeldes Sedert 'n tydreeks kan as 'n stel waardes beskou word,, t 1,2,3,4, N die gemiddeld van hierdie waardes kan bereken word. As ons aanvaar dat N is nogal groot, en ons kies 'n heelgetal k wat is veel kleiner as n. kan ons 'n stel van blok gemiddeldes, of eenvoudig bewegende gemiddeldes (van orde k) bereken: Elke maat verteenwoordig die gemiddelde van al die datawaardes oor 'n interval van k waarnemings. Let daarop dat die eerste moontlike MA van orde k gt0 is dat vir t k. Meer in die algemeen kan ons die ekstra onderskrif val in die uitdrukkings bo en skryf: Dit bepaal dat die geskatte gemiddelde op tydstip t is die eenvoudige gemiddelde van die waargeneem waarde op tydstip t en die voorafgaande k -1 tyd stappe. As gewigte word toegepas wat die bydrae van waarnemings wat verder weg in die tyd is verminder, is die bewegende gemiddelde gesê eksponensieel word stryk. Bewegende gemiddeldes word dikwels gebruik as 'n vorm van vooruitskatting, waardeur die beraamde waarde vir 'n reeks op tydstip t 1, S T1. geneem word as die MA vir die tydperk tot en met tyd t. bv vandag se skatting is gebaseer op 'n gemiddelde van vorige aangeteken waardes tot en met gister se (vir daaglikse data). Eenvoudige bewegende gemiddeldes kan gesien word as 'n vorm van gladstryking. In die onderstaande diagram getoon word byvoorbeeld het die lugbesoedeling dataset getoon in die inleiding tot hierdie onderwerp is aangevul deur 'n 7-daagse bewegende gemiddelde (MA) reël, hier in rooi. Soos gesien kan word, die MA lyn glad uit die pieke en trôe in die data en kan baie nuttig wees in die identifisering van tendense wees. Die standaard toekomsgerigte berekening formule beteken dat die eerste k -1 datapunte het geen MA waarde, maar daarna berekeninge uit te brei na die finale data punt in die reeks. PM10 daaglikse gemiddelde waardes, Greenwich bron: London Luggehalte Network, www. londonair. org. uk Een rede vir die berekening van eenvoudige bewegende gemiddeldes op die voorgeskrewe wyse, is dat dit in staat stel om waardes te bereken vir alle tydgleuwe van tyd tk tot op hede en as 'n nuwe meting verkry vir tyd t 1, die MA vir tyd t 1 kan die reeds bereken stel bygevoeg. Dit bied 'n eenvoudige prosedure vir 'n dinamiese datastelle. Daar is egter 'n paar probleme met hierdie benadering. Dit is redelik om te argumenteer dat die gemiddelde waarde van die afgelope 3 periodes, sê, moet geleë wees op tyd t -1, nie tyd t. en vir 'n MA oor 'n gelyke getal periodes miskien is dit moet geleë wees by die middelpunt tussen twee tyd intervalle. 'N oplossing vir hierdie probleem is om gesentreer MA berekeninge, waarin die MA op tydstip t is die gemiddeld van 'n simmetriese stel waardes rondom t gebruik. Ten spyte van die ooglopende meriete, is hierdie benadering nie oor die algemeen gebruik word, want dit vereis dat data is beskikbaar vir toekomstige gebeure, wat nie die geval mag wees. In gevalle waar analise is geheel en al van 'n bestaande reeks, kan die gebruik van gesentreer Mas beter wees. Eenvoudige bewegende gemiddeldes kan beskou word as 'n vorm van gladstryking, die verwydering van 'n paar hoë frekwensie komponente van 'n tydreeks en beklemtoon (maar nie die verwydering van) tendense in 'n soortgelyke wyse as die algemene opvatting van digitale filter. Inderdaad, bewegende gemiddeldes is 'n vorm van lineêre filter. Dit is moontlik om 'n bewegende gemiddelde berekening van toepassing op 'n reeks wat reeds stryk, dit wil sê glad of filter 'n reeds stryk reeks. Byvoorbeeld, met 'n bewegende gemiddelde van orde 2, ons kan dit beskou as synde bereken met behulp van gewigte, sodat die MA by x 2 0.5 x 1 0.5 x 2. Net so, die MA by x 3 0.5 x 2 0.5 x 3. As ons dien 'n tweede vlak van gladstryking of filter, ons het 0,5 x 2 0.5 x 3 0.5 (0.5 x 1 0.5 x 2) 0.5 (0.5 x 2 0.5 x 3) 0.25 x 1 0.5 x 2 0,25 x 3 dws die 2-stadium filter proses (of konvolusie) het 'n wisselvallig geweegde simmetriese bewegende gemiddelde, met gewigte vervaardig. Veelvuldige konvolusie kan ingewikkeld geweegde bewegende gemiddeldes, waarvan sommige is gevind veral gebruik in gespesialiseerde velde, soos in lewensversekering berekeninge te produseer. Bewegende gemiddeldes gebruik kan word om periodieke effekte verwyder indien bereken met die lengte van die periodisiteit as 'n bekende. Byvoorbeeld, met 'n maandelikse data seisoenale variasies dikwels verwyder kan word (indien dit die doel) deur toe te pas 'n simmetriese 12 maande bewegende gemiddelde met al maande gelyke gewigte, behalwe die eerste en laaste wat geweeg deur 1/2. Dit is omdat daar sal 13 maande in die simmetriese model (huidige tyd, t / -. 6 maande). Die totale is gedeel deur 12. Soortgelyke prosedures kan vir enige goed gedefinieerde periodisiteit word aangeneem. Eksponensieel geweeg bewegende gemiddeldes (EWMA) Met die eenvoudige bewegende gemiddelde formule: alle waarnemings is ewe geweegde. As ons noem hulle die gelyke gewigte, Alpha t. elk van die k gewigte sou gelyk 1 / k. sodat die som van die gewigte sal wees 1, en die formule sou wees: Ons het reeds gesien dat verskeie programme van hierdie proses lei tot die gewigte wissel. Met eksponensieel geweeg bewegende gemiddeldes die bydrae tot die gemiddelde waarde van waarnemings wat meer verwyder betyds beraadslaag verminder, en sodoende meer onlangse (plaaslike) gebeure beklemtoon. In wese 'n glad parameter, 0lt Alpha LT1, is bekend gestel, en die formule hersien om 'n simmetriese weergawe van hierdie formule van die vorm sal wees: As die gewigte in die simmetriese model is gekies as die terme van die bepalings van die binomiale uitbreiding, (1/21/2) 2S. hulle sal vat om 1, en as Q groot word, sal die normaalverdeling benader. Dit is 'n vorm van kern gewig, met die Binomiale optree as die kern funksie. Die twee stadium konvolusie in die vorige subartikel beskryf is juis hierdie reëling, met Q 1, opbrengs die gewigte. In eksponensiële gladstryking is dit nodig om 'n stel gewigte gebruik wat som tot 1 en wat verminder in grootte meetkundig. Die gewigte gebruik is tipies van die vorm: Om te wys dat hierdie gewigte op te som tot 1, oorweeg die uitbreiding van 1 / as 'n reeks. Ons kan skryf en die uitdrukking in hakies gebruik te maak van die binomiale formule (1- x) p brei. waar x (1-) en p -1, wat gee: Dit bied dan 'n vorm van geweegde bewegende gemiddelde van die vorm: Hierdie opsomming kan geskryf word as 'n herhaling verhouding: wat berekening grootliks vereenvoudig, en vermy die probleem wat die gewig regime moet streng oneindige wees vir die gewigte op te som tot 1 (vir klein waardes van alfa. hierdie is tipies nie die geval). Die notasie wat gebruik word deur verskillende skrywers wissel. Sommige gebruik die letter S aan te dui dat die formule is in wese 'n reëlmatige veranderlike, en skryf: terwyl die beheerteorie literatuur gebruik dikwels Z eerder as S vir die eksponensieel geweeg of glad waardes (sien, byvoorbeeld, Lucas en Saccucci, 1990, LUC1 , en die NIST webwerf vir meer besonderhede en uitgewerkte voorbeelde). Bogenoemde aangehaal formules uit die werk van Roberts (1959 ROB1), maar Hunter (1986, HUN1) gebruik 'n uitdrukking van die vorm: wat meer geskik is vir gebruik in 'n paar prosedures kan wees. Met alfa 1 die gemiddelde skatting is eenvoudig sy gemeet waarde (of die waarde van die vorige data-item). Met 0,5 die skatting is die eenvoudige bewegende gemiddelde van die huidige en vorige metings. In voorspellingsmodelle die waarde, S t. word dikwels gebruik as die skatting of voorspelling waarde vir die volgende tydperk, dit wil sê as die skatting vir x op tydstip t 1. So ons het: Dit dui aan dat die voorspelling waarde op tydstip t 1 is 'n kombinasie van die vorige eksponensieel geweeg bewegende gemiddelde plus 'n komponent wat die geweegde voorspelling fout, Epsilon verteenwoordig. op tyd t. Die aanvaarding van 'n tydreeks gegee en 'n voorspelling is nodig, word 'n waarde vir Alpha vereis. Dit kan geskat word van die bestaande data deur die evaluering van die som van 'n vierkant voorspelling foute te kry met wisselende waardes van Alpha vir elke T 2,3. die opstel van die eerste skatting van die eerste waargenome data waarde wees, x 1. In beheer aansoeke ter waarde van Alpha is belangrik in wat gebruik word in die bepaling van die boonste en onderste beheer perke, en raak die gemiddelde duur lank (ARL) verwag voor hierdie beheer perke is gebreek (onder die aanname dat die tyd reeks verteenwoordig 'n stel van ewekansige, identies verdeelde onafhanklike veranderlikes met 'n gemeenskaplike variansie). Onder hierdie omstandighede die variansie van die beheer statistiek: is (Lucas en Saccucci, 1990): beheer perke word gewoonlik gestel as vaste veelvoude van hierdie asimptotiese variansie, bv / - 3 keer die standaardafwyking. 1,134 en die proses sal een of ander perk in 500 bereik - As alfa 0,25, byvoorbeeld, en die data wat gemonitor word aangeneem dat 'n normale verspreiding, N (0,1) het, terwyl dit in beheer, die beheer perke sal / kan stappe op die gemiddelde. Lucas en Saccucci (1990 LUC1) lei die ARLs vir 'n wye verskeidenheid van alfa waardes en onder verskillende aannames met behulp van Markov Chain prosedures. Hulle tabuleer die resultate, insluitend die verskaffing van ARLs wanneer die gemiddelde van die beheerproses is verskuif deur sommige verskeie van die standaardafwyking. Byvoorbeeld, met 'n 0.5 verskuiwing met alfa 0,25 die ARL is minder as 50 keer stappe. Die hierbo beskryf benaderings staan ​​bekend as een eksponensiële gladstryking. as die prosedures wat eenmaal aan die tydreeks toegepas en dan ontleed of beheer prosesse uit op die gevolglike stryk dataset gedra. As die dataset sluit 'n tendens en / of seisoenale komponente, twee - of drie-fase eksponensiële gladstryking kan hieronder toegedien word as 'n middel van die verwydering (uitdruklik modellering) hierdie effekte (sien verder, die afdeling oor vooruitskatting., En die NIST uitgewerkte voorbeeld ). CHA1 Chat Field C (1975) die ontleding van Times Reeks: teorie en praktyk. Chapman en Hall, Londen HUN1 Hunter J S (1986) Die eksponensieel geweeg bewegende gemiddelde. J van kwaliteit Tegnologie, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) eksponensieel Geweegde Moving Gemiddelde beheer Skemas: Properties en verbeteringe. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) beheer Chart Toetse Op grond van Meetkundige bewegende gemiddeldes. Technometrics, 1, 239-250Moving Gemiddeldes en gesentreerde Bewegende Gemiddeldes n paar punte oor seisoenaliteit in 'n tydreeks beer herhaal, selfs al is dit lyk asof hulle voor die hand liggend. Een daarvan is dat die term 8220season8221 nie noodwendig verwys na die vier seisoene van die jaar wat die gevolg is van die kantel van die Earth8217s as. In predictive analytics, 8220season8221 beteken dikwels juis dat, omdat baie van die verskynsels wat ons bestudeer nie wissel saam met die vordering van die lente deur die winter: verkope van die winter of somer rat, insidensie van sekere wydverspreide siektes, weersomstandighede wat veroorsaak word deur die ligging van die jetstream en veranderinge in die temperatuur van die water in die oostelike Stille Oseaan, en so aan. Ewe, kan gebeure wat gereeld voorkom op te tree soos meteorologiese seisoene, selfs al is hulle net 'n vaag verbinding met die seizoenen. Agt-uur skofte in hospitale en fabrieke kry dikwels uitgedruk in die voorkoms van innames en uitgawes van energie daar, 'n seisoen is agt uur lank en die seisoene siklus elke dag, nie elke jaar. Sperdatums vir belasting sein die begin van 'n vloed van dollars in munisipale, staats-en federale skatkamers daar, kan die seisoen een jaar lank (persoonlike inkomstebelasting), ses maande (eiendomsbelasting in baie lande), kwartaallikse (baie korporatiewe belasting ), en so aan. It8217s 'n bietjie vreemd dat ons die woord 8220season8221 algemeen verwys na die gereeld herhalende periode van tyd, maar geen algemene term vir die tydperk waartydens een volle draai van die seisoene kom. 8220Cycle8221 is moontlik, maar in analytics en vooruitskatting daardie kwartaal gewoonlik na 'n tydperk van onbepaalde lengte, beteken soos 'n sakesiklus. In die afwesigheid van 'n beter term, I8217ve gebruik 8220encompassing period8221 in hierdie en daaropvolgende hoofstukke. Dit isn8217t net terminologiese gesug. Die maniere identifiseer ons seisoene en die tydperk waartydens die seisoene draai het ware, indien dikwels klein, implikasies vir hoe ons die gevolge daarvan te meet. Die volgende afdelings bespreek hoe sommige ontleders verskil die manier waarop hulle ook vertroud te bewegende gemiddeldes na gelang van die aantal seisoene is vreemd of selfs. Die gebruik van bewegende gemiddeldes In plaas van Simple Gemiddeldes Veronderstel dat 'n groot stad is die oorweging van die herverdeling van die verkeerspolisie om die voorkoms van bestuur terwyl verswakte, wat die stad is van mening is steeds beter aan te spreek. Vier weke gelede het nuwe wetgewing in werking getree het, die wettiging van die besit en ontspanningsgebruik van dagga. Sedertdien het die daaglikse aantal verkeer arrestasies vir DWI blyk te wees trending op. Kompliserende sake is die feit dat die aantal arrestasies blyk te piek op Vrydae en Saterdae. Plan vir mannekrag vereistes in die toekoms te help, you8217d graag enige onderliggende tendens that8217s tot stand gebring voorspel. You8217d ook graag die ontplooiing van jou hulpbronne tyd om rekening van enige naweek verwant seisoenaliteit neem that8217s plaasvind. Figuur 5.9 het die betrokke inligting wat jy het om te werk met. Figuur 5.9 Met hierdie datastel, elke dag van die week maak 'n seisoen. Selfs deur net eyeballing die grafiek in Figuur 5.9. jy kan sê dat die tendens van die aantal daaglikse arrestasies is tot. You8217ll moet beplan om die aantal verkeersbeamptes uit te brei, en hoop dat die tendens vlakke af gou. Verdere, die data dra uit die idee dat meer arrestasies voorkom gereeld op Vrydae en Saterdae, sodat jou hulpbrontoekenning moet diegene spykers aan te spreek. Maar jy moet die onderliggende tendens kwantifiseer, te bepaal hoeveel bykomende polisie you8217ll moet op te bring. Jy moet ook die verwagte grootte van die naweek spykers kwantifiseer, te bepaal hoeveel bykomende polisie jy hoef te kyk vir wisselvallige bestuurders op daardie dae. Die probleem is dat as van nog jy don8217t weet hoeveel van die daaglikse toename is te danke aan tendens en hoeveel is te danke aan daardie naweek effek. Jy kan begin deur detrending die tydreeks. Vroeër in hierdie hoofstuk, in 8220Simple Seisoene gemiddeldes, 8221 sien jy 'n voorbeeld van hoe om 'n tydreeks detrend om die seisoenale effekte met behulp van die metode van eenvoudige gemiddeldes isoleer. In hierdie afdeling you8217ll sien hoe om dit te doen deur gebruik te maak beweeg averages8212very waarskynlik, is die bewegende-gemiddeldes benadering meer dikwels gebruik word in predictive analytics as die eenvoudige-gemiddeldes benadering. Daar is verskeie redes vir die groter gewildheid van bewegende gemiddeldes, onder hulle, wat op die roering-gemiddeldes benadering jou nie vra om jou data te val in die proses van kwantifisering n tendens. Onthou dat die vorige voorbeeld het dit nodig om kwartaallikse gemiddeldes val om jaarlikse gemiddeldes, bereken 'n jaarlikse tendens, en dan versprei 'n kwart van die jaarlikse tendens oor elke kwartaal van die jaar. Dit stap is nodig om tendens van die seisoenale effekte verwyder. In teenstelling hiermee het die bewegende-gemiddeldes benadering maak dit moontlik om die tydreeks detrend sonder om dié soort van intrige. Figuur 5.10 toon hoe die bewegende-gemiddeldes benadering werk in die huidige voorbeeld. Figuur 5.10 Die bewegende gemiddelde in die tweede grafiek verduidelik die onderliggende tendens. Figuur 5.10 gee 'n bewegende gemiddelde kolom, en 'n kolom vir spesifieke seasonals. om die wat in Figuur 5.9 data. Beide toevoegings vereis 'n bespreking. Die spykers in hegtenis wat plaasvind oor naweke gee jou rede om te glo dat you8217re werk met seisoene wat eens elke week herhaal. Daarom begin deur om die gemiddelde vir die omvattende period8212that is, die eerste sewe seisoene, Maandag tot Sondag. Die formule vir die gemiddelde in sel D5, die eerste beskikbare bewegende gemiddelde, is soos volg: Dit formule gekopieer en geplak af deur sel D29, sodat jy 25 bewegende gemiddeldes gebaseer op 25 lopies van sewe agtereenvolgende dae. Let daarop dat ten einde beide die eerste en die laaste paar waarnemings in die tydreeks te wys, het ek verborge rye 10 deur 17 Jy kan dit sigbaar te maak, as jy wil, in hierdie chapter8217s werkboek, beskikbaar by die publisher8217s webwerf. Maak 'n meervoudige keuse van sigbare rye 9 en 18, regs-kliek op een van hul ry kop, en kies Wys uit die snel menu. As jy 'n worksheet8217s rye weg te steek, as I8217ve gedoen in figuur 5.10. enige Geoktrooieerde data in die verborge rye is ook weggesteek op die grafiek. Die x-as etikette identifiseer net die datapunte wat op die grafiek verskyn. Omdat elke bewegende gemiddelde in Figuur 5.10 sluit sewe dae, is geen bewegende gemiddelde saam met die eerste drie of laaste drie werklike waarnemings. Kopieer en plak die formule in sel D5 op 'n dag tot sel D4 loop jy uit observations8212there is geen waarneming opgeneem in sel C1. Net so, is daar geen bewegende gemiddelde hieronder sel D29 aangeteken. Kopieer en plak die formule in D29 in D30 sou 'n waarneming in sel C33 vereis, en geen waarneming is beskikbaar vir die dag wat sel sou verteenwoordig. Dit sou moontlik wees, natuurlik, om die lengte van die bewegende gemiddelde verkort om, sê, vyf in plaas van sewe. Deur dit te doen sal beteken dat die bewegende gemiddelde formules in figuur 5.10 kan begin in sel D4 in plaas van D5. Maar in hierdie soort ontleding, jy wil die lengte van die bewegende gemiddelde van die aantal seisoene gelyk: sewe dae in 'n week vir gebeure wat weekliks herhaal impliseer 'n bewegende gemiddelde lengte sewe en vier kwartale in 'n jaar vir die gebeure wat jaarliks ​​herhaal impliseer 'n bewegende gemiddelde lengte vier. Saam soortgelyke lyne, ons oor die algemeen seisoenale effekte op so 'n manier dat hulle totaal nul binne die omvattende tydperk kwantifiseer. As jy in hierdie chapter8217s eerste artikel gesien het, op eenvoudige gemiddeldes, dit word gedoen deur die berekening van die gemiddelde van (sê) die vier kwartale in 'n jaar, en dan trek die gemiddelde vir die jaar uit elke kwartaallikse figuur. Sodoende verseker dat die totale van die seisoenale effekte is nul. Op sy beurt het that8217s nuttig omdat dit sit die seisoenale effekte op 'n gemeenskaplike footing8212a somer effek van 11 is so ver van die gemiddelde as 'n winter effek van 821111. As jy wil vyf seisoene in plaas van sewe gemiddeld tot jou bewegende gemiddelde te kry, you8217re beter af om 'n verskynsel wat elke vyf seisoene in plaas van sewe herhaal. Maar wanneer jy die gemiddeld van die seisoenale effekte later in die proses te neem, die gemiddeldes is onwaarskynlik dat som aan nul. It8217s nodig op daardie stadium te lyn met sy wil, of te normaliseer. die gemiddeldes sodat hulle som is nul. Wanneer that8217s gedoen, die gemiddelde seisoenale gemiddeldes druk die effek op 'n tydperk van behoort aan 'n bepaalde seisoen. Sodra genormaliseer, is die seisoenale gemiddeldes genoem die seisoenale indekse wat hierdie hoofstuk reeds 'n paar keer genoem. You8217ll sien hoe dit werk later in hierdie hoofstuk, in 8220Detrending die reeks met bewegende Averages.8221 Verstaan ​​Spesifieke Seasonals Figuur 5.10 toon ook wat is spesifieke seasonals in kolom E. genoem Hulle is what8217s links na aftrekking van die bewegende gemiddelde van die werklike waarneming. Om 'n gevoel van wat die spesifieke seasonals verteenwoordig te kry, kyk na die bewegende gemiddelde in sel D5. Dit is die gemiddeld van die waarnemings in C2: C8. Die afwykings van elke waarneming van die bewegende gemiddelde (byvoorbeeld, C2 8211 D5) is gewaarborg om op te som 'n kenmerk van 'n gemiddelde zero8212that8217s. Dus, elke afwyking gee uitdrukking aan die effek van wat verband hou met daardie spesifieke dag in daardie spesifieke week. It8217s n spesifieke seisoen, then8212specific omdat die afwyking van toepassing op daardie spesifieke Maandag of Dinsdag en so aan, en seisoenale want in hierdie voorbeeld we8217re elke dag behandel asof dit 'n tyd lank in die omvattende tydperk van 'n week. Omdat elke spesifieke seisoenale maatreëls die effek van wat in daardie tyd ten 224-vis die bewegende gemiddelde vir daardie groep (hier) sewe seisoene, kan jy daarna Gemiddeld spesifieke seasonals vir 'n bepaalde seisoen (byvoorbeeld, al die Vrydae in jou tydreekse) om te skat wat season8217s algemeen, eerder as spesifieke, effek. Dit gemiddelde word nie beskaamd deur 'n onderliggende tendens in die tydreeks, want elke spesifieke seisoenale uitdrukking aan 'n afwyking van sy eie besondere bewegende gemiddelde. Aanpassing van die Moving Gemiddeldes There8217s ook die kwessie van die aanpassing van die bewegende gemiddeldes met die oorspronklike datastel. In Figuur 5.10. Ek het elke bewegende gemiddelde lyn met die middelpunt van die reeks waarnemings wat dit insluit. So, byvoorbeeld, die formule sel D5 gemiddeldes in die waarnemings in C2: C8, en ek het dit in lyn met die vierde waarneming, die middelpunt van die gemiddeld reeks, deur dit in ry 5. Hierdie reëling is die sogenaamde 'n gesentreerde bewegende gemiddelde . en baie ontleders verkies om elke bewegende gemiddelde in lyn met die middelpunt van die waarnemings wat dit gemiddeldes. Hou in gedagte dat in hierdie konteks, 8220midpoint8221 verwys na die middel van 'n tydsduur: Donderdag is die middelpunt van Maandag tot Sondag. Dit verwys nie na die mediaan van die waargeneem waardes, hoewel natuurlik is dit dalk so uitgewerk nie in die praktyk. 'N Ander benadering is die sleep bewegende gemiddelde. In daardie geval, is elke bewegende gemiddelde lyn met die laaste opmerking dat dit averages8212and daarom roetes agter sy argumente. Dit is dikwels die voorkeur reëling as jy wil 'n bewegende gemiddelde gebruik as 'n voorspelling, soos gedoen word met eksponensiële gladstryking, omdat jou finale bewegende gemiddelde voorkom samevallende met die finale beskikbaar waarneming. Gesentreer Bewegende Gemiddeldes met ewe getalle van seisoene Ons gewoonlik neem 'n spesiale prosedure wanneer die aantal seisoene is selfs eerder as vreemd. That8217s die tipiese toedrag van sake: Daar is geneig om ewe getalle van seisoene in die omvattende tydperk vir 'n tipiese seisoene wees soos maande, kwartale, en vier jaarlikse periodes (vir verkiesings). Die probleem met 'n ewe aantal seisoene is dat daar geen middelpunt. Twee is nie die middelpunt van 'n reeks begin by 1 en eindig op 4, en nie is 3 of dit kan gesê word om een ​​te hê, sy middelpunt is 2.5. Ses is nie die middelpunt van 1 tot 12, en nie is 7 sy suiwer teoretiese middelpunt is 6.5. Om op te tree asof 'n middelpunt bestaan, moet jy 'n laag van gemiddeld bo die bewegende gemiddeldes te voeg. Sien Figuur 5.11. Figuur 5.11 Excel bied verskeie maniere om 'n gesentreerde bewegende gemiddelde te bereken. Die idee agter hierdie benadering tot om 'n bewegende gemiddelde that8217s gesentreer op 'n bestaande middelpunt toe there8217s 'n gelyke getal seisoene, is om daardie middelpunt vorentoe trek deur 'n halwe seisoen. Jy kan bereken 'n bewegende gemiddelde wat by, sê, die derde punt sou wees gesentreer in die tyd as vyf seisoene in plaas van vier saamgestel een volle draai van die kalender. That8217s gedoen deur twee agtereenvolgende bewegende gemiddeldes en hulle gemiddeld. So in Figuur 5.11. there8217s n bewegende gemiddelde in sel E6 dat gemiddeldes die waardes in D3: D9. Omdat daar vier seisoenale waardes in D3: D9, is die bewegende gemiddelde in E6 beskou as gesentreer op die denkbeeldige seisoen 2.5, 'n halwe punt kort van die eerste beskikbare kandidaat seisoen, 3. (Seisoene 1 en 2 is nie beskikbaar as middelpunte vir 'n gebrek aan data om gemiddeld voor Seisoen 1.) Let egter dat die bewegende gemiddelde sel E8 gemiddeldes in die waardes in D5: D11, die tweede deur die vyfde plek in die tydreeks. Dat die gemiddelde is gesentreer op (denkbeeldige) wys 3.5, 'n volle tydperk wat voorlê van die gemiddelde gesentreer op 2.5. Deur die gemiddeld van die twee bewegende gemiddeldes, sodat die denke gaan, kan jy die middelpunt van die eerste bewegende gemiddelde vorentoe trek met 'n halwe punt van 2,5 tot 3 That8217s wat die gemiddeldes in kolom F van figuur 5.11 doen. Cell F7 bied die gemiddelde van die bewegende gemiddeldes in E6 en E8. En die gemiddelde in F7 is in lyn met die derde data punt in die oorspronklike tydreekse, in sel D7, om te beklemtoon dat die gemiddelde is gesentreer op daardie seisoen. As jy die formule in sel F7 asook die bewegende gemiddeldes in selle E6 en E8 brei, you8217ll sien dat dit blyk om 'n geweegde gemiddelde van die eerste vyf waardes in die tyd reeks wees, met die eerste en vyfde waarde gegee word 'n gewig van 1, en die tweede deur vierde waardes gegewe 'n gewig van 2. Dit lei ons na 'n vinniger en makliker manier om 'n gesentreerde bewegende gemiddelde bereken met 'n ewe aantal seisoene. Nog in Figuur 5.11. die gewigte word gestoor in die reeks H3: H11. Hierdie formule gee die eerste gesentreerde bewegende gemiddelde, in sel I7: Dit formule terug 13,75. wat identies is aan die waarde bereken deur die dubbel-gemiddelde formule in sel F7. Die maak van die verwysing na die gewigte absolute, deur middel van die dollar tekens in H3: H11. jy kan die formule kopieer en plak dit af so ver as wat nodig is om die res van die gesentreerde bewegende gemiddeldes te kry. Detrending die reeks met bewegende gemiddeldes Wanneer jy die bewegende gemiddeldes van die oorspronklike waarnemings afgetrek om die spesifieke seasonals kry, het jy die onderliggende tendens van die reeks verwyder. What8217s links in die spesifieke seasonals is gewoonlik 'n stilstaande, horisontale reeks met twee effekte wat veroorsaak dat die spesifieke seasonals af te wyk van 'n absoluut reguit lyn: die seisoenale effekte en ewekansige fout in die oorspronklike waarnemings. Figuur 5.12 toon die resultate vir hierdie voorbeeld. Figuur 5.12 Die spesifieke seisoenale effekte vir Vrydag en Saterdag bly duidelik in die detrended reeks. Die boonste grafiek in Figuur 5.12 toon die oorspronklike daaglikse waarnemings. Beide die algemene opwaartse neiging en die naweek seisoenale spykers is duidelik. Die onderste grafiek toon die spesifieke seasonals: die resultaat van detrending die oorspronklike reeks met 'n bewegende gemiddelde filter, soos beskryf vroeër in 8220Understanding Spesifieke Seasonals.8221 Jy kan sien dat die detrended reeks is nou feitlik horisontale ( 'n lineêre tendenslyn vir die spesifieke seasonals het 'n effense afwaartse drif), maar die seisoenale Vrydag en Saterdag spykers is steeds in plek. Die volgende stap is om te beweeg na die spesifieke seasonals om die seisoenale indekse. Sien Figuur 5.13. Figuur 5.13 Die spesifieke seasonals effekte eerste gemiddeld en dan genormaliseer tot die seisoenale indekse bereik. In Figuur 5.13. die spesifieke seasonals in kolom E herrangskik in die tabel getoon in die reeks H4: N7. Die doel is eenvoudig om te maak dit makliker om die seisoenale gemiddeldes te bereken. Diegene gemiddeldes word in H11: N11. Maar die figure in H11: N11 is gemiddeldes, nie afwykings van 'n gemiddelde, en dus can8217t ons verwag dat hulle som aan nul. Ons moet nog aan te pas sodat hulle afwykings van 'n groot gemiddelde uit te druk. Dit Grand gemiddelde verskyn in sel N13, en is die gemiddelde van die seisoenale gemiddeldes. Ons kan kom by die seisoenale indekse deur af te trek die Grand gemiddelde in N13 uit elk van die seisoenale gemiddeldes. Die gevolg is in die reeks H17: N17. Hierdie seisoenale indekse is nie meer spesifiek vir 'n bepaalde bewegende gemiddelde, soos in die geval met die spesifieke seasonals in kolom E. Omdat they8217re gebaseer op 'n gemiddeld van elke geval van 'n gegewe tyd, hulle druk die gemiddelde effek van 'n gegewe tyd oor die vier weke in die tyd reeks. Verder is hulle maatstawwe van 'n season8217s8212here, 'n day8217s8212effect op verkeer arrestasies ten 224-vis die gemiddelde vir 'n tydperk van sewe dae. Ons kan nou gebruik die seisoenale indekse om die reeks deseasonalize. We8217ll gebruik die seisoen gezuiverde reeks om voorspellings te kry deur middel van lineêre regressie of Holt8217s metode van glad tendens reeks (bespreek in Hoofstuk 4). 2. 2. 31.


No comments:

Post a Comment