Flytende gjennomsnitt Dette eksemplet lærer deg hvordan du beregner det bevegelige gjennomsnittet av en tidsserie i Excel. Et glidende gjennomsnitt brukes til å utjevne uregelmessigheter (topper og daler) for enkelt å gjenkjenne trender. 1. Først, ta en titt på vår tidsserie. 2. På Data-fanen klikker du Dataanalyse. Merk: kan ikke finne dataanalyseknappen Klikk her for å laste inn add-in for Analysis ToolPak. 3. Velg Flytt gjennomsnitt og klikk OK. 4. Klikk i feltet Inngangsområde og velg området B2: M2. 5. Klikk i intervallboksen og skriv inn 6. 6. Klikk i feltet Utmatingsområde og velg celle B3. 8. Skriv en graf av disse verdiene. Forklaring: fordi vi angir intervallet til 6, er glidende gjennomsnitt gjennomsnittet for de forrige 5 datapunktene og det nåværende datapunktet. Som et resultat blir tinder og daler utjevnet. Grafen viser en økende trend. Excel kan ikke beregne det bevegelige gjennomsnittet for de første 5 datapunktene fordi det ikke er nok tidligere datapunkter. 9. Gjenta trinn 2 til 8 for intervall 2 og intervall 4. Konklusjon: Jo større intervallet jo flere tinder og daler utjevnes. Jo mindre intervallet, desto nærmere er de bevegelige gjennomsnittene til de faktiske datapunktene. Seriell korrelasjon Hva er seriell korrelasjon Seriell korrelasjon er forholdet mellom en gitt variabel og seg selv over ulike tidsintervaller. Serielle korrelasjoner finnes ofte i gjentatte mønstre, når nivået på en variabel påvirker sitt fremtidige nivå. I økonomi brukes denne korrelasjonen av tekniske analytikere til å bestemme hvor godt den tidligere prisen på et sikkerhetsspørsmål forutsetter fremtidig pris. BREAKER NED Seriell korrelasjon Begrepet seriell korrelasjon kan også refereres til som autokorrelasjon eller forsinket korrelasjon. Seriell korrelasjon er et begrep som brukes i statistikk for å beskrive forholdet mellom observasjoner av samme variabel over bestemte tidsperioder. Hvis en variabel seriell korrelasjon måles til å være null, betyr det at det ikke er korrelasjon, og hver av observasjonene er uavhengige av hverandre. Omvendt, hvis en seriell korrelasjon av variabler skiller seg mot en, betyr det at observasjonene er serielt korrelerte, og at fremtidige observasjoner påvirkes av tidligere verdier. I hovedsak er en variabel som er serielt korrelert et mønster og ikke tilfeldig. Tiltak av seriell korrelasjon brukes i teknisk analyse når man analyserer et sikkerhetsmønster. Analysen er helt basert på en aksjekursbevegelse og det tilhørende volumet, i stedet for et selskaps grunnleggende. Utøvere av teknisk analyse, hvis de bruker seriell korrelasjon på riktig måte, er i stand til å finne og validere de lønnsomme mønstrene eller en sikkerhet eller en gruppe verdipapirer, og få øye på investeringsmuligheter. Konseptet med seriell korrelasjon Ideen bak seriell korrelasjon er at den opprinnelig ble brukt til å bestemme hvordan et signal, som et datasignal eller en radiobølge, varierer med seg selv over tid. Det begynte å fange seg i økonomiske kretser som økonomer og partisjoner av økonometri brukte det til å analysere økonomiske data over tid. Disse akademikerne begynte å forlate akademia på jakt etter Wall Street. og på 1980-tallet ble bruken av seriell korrelasjon brukt til å forutsi aksjekursene. Nesten alle store finansinstitusjoner har nå kvantitative analytikere, kjent som kvanter, på ansatte. Disse finansielle handelsanalytikere bruker teknisk analyse og andre statistiske påvirkninger for å analysere og forutsi aksjemarkedet. Disse quants er integrert i suksessen til mange av disse finansinstitusjonene, siden de er avhengige av å tilby markedsmodeller som institusjonen da bruker som grunnlag for sin investeringsstrategi. Seriell korrelasjon blant disse quants er bestemt ved bruk av Durbin-Watson-testen. Korrelasjonen kan enten være positiv eller negativ. En aksjekurs som viser positiv seriell korrelasjon, som man vil gjette, betyr at korrelasjonen har et positivt mønster. En sikkerhet som har en negativ seriell korrelasjon, har derimot en negativ innflytelse på seg selv over tid. Mål: Sjekk Randomness Autocorrelation plots (Box og Jenkins, s. 28-32) er et vanlig brukt verktøy for å sjekke tilfeldighet i et datasett. Denne tilfeldigheten er fastslått ved å beregne autokorrelasjoner for dataværdier ved varierende tidsforsinkelser. Hvis tilfeldig, bør slike autokorrelasjoner være nær null for alle tidsforsinkelsesavvik. Hvis ikke-tilfeldig, vil en eller flere av autokorrelasjonene være betydelig ikke-null. I tillegg brukes autokorrelasjonsplott i modellidentifikasjonsfasen for Box-Jenkins autoregressive, bevegelige gjennomsnittlige tidsseriemodeller. Autokorrelasjon er bare ett mål for tilfeldighet. Merk at ukorrelert ikke nødvendigvis betyr tilfeldig. Data som har betydelig autokorrelasjon er ikke tilfeldig. Data, som ikke viser signifikant autokorrelasjon, kan likevel vise seg tilfeldig på andre måter. Autokorrelasjon er bare et mål for tilfeldighet. I sammenheng med modellvalidering (som er den primære typen tilfeldighet som vi skriver i håndboken), er kontroll av autokorrelasjon vanligvis en tilstrekkelig test av tilfeldighet siden resterne fra en dårlig passende modeller har en tendens til å vise ikke-subtil tilfeldighet. Noen programmer krever imidlertid en strengere bestemmelse av tilfeldighet. I disse tilfellene blir det brukt et batteri av tester, som kan omfatte kontroll av autokorrelasjon, da data kan være ikke-tilfeldig på mange forskjellige og ofte subtile måter. Et eksempel på hvor det er behov for en strengere kontroll for tilfeldighet, ville være å teste tilfeldige tallgivere. Eksempelplott: Autokorrelasjoner bør være nær null for tilfeldighet. Slik er ikke tilfellet i dette eksemplet, og dermed slår tilfeldighetsforutsetningen bort. Denne utvalgsautokorrelasjonsplottet viser at tidsserien ikke er tilfeldig, men har snarere en høy grad av autokorrelasjon mellom tilstøtende og nærliggende observasjoner. Definisjon: r (h) versus h Autokorrelasjonsplottene dannes av Vertikal akse: Autokorrelasjonskoeffisient der Ch er autokovariansfunksjonen og C 0 er variansfunksjonen Merk at R h er mellom -1 og 1. Merk at enkelte kilder kan bruke Følgende formel for autokovariansfunksjonen Selv om denne definisjonen har mindre bias, har formuleringen (1N) noen ønskelige statistiske egenskaper og er formen som oftest brukes i statistikklitteraturen. Se side 20 og 49-50 i Chatfield for detaljer. Horisontal akse: Tidsforsinkelse h (h 1, 2, 3.) Ovenstående linje inneholder også flere horisontale referanselinjer. Midtlinjen er null. De andre fire linjene er 95 og 99 konfidensbånd. Merk at det er to forskjellige formler for å generere konfidensbåndene. Hvis autokorrelasjonsplottet brukes til å teste for tilfeldighet (det er ingen tidsavhengighet i dataene), anbefales følgende formel: hvor N er prøvestørrelsen, er z den kumulative fordelingsfunksjonen til standard normalfordeling og (alfa ) er signifikansnivået. I dette tilfellet har konfidensbåndene en fast bredde som avhenger av prøvestørrelsen. Dette er formelen som ble brukt til å generere konfidensbåndene i det ovenstående diagrammet. Autocorrelation plots brukes også i modellidentifikasjonstrinnet for montering av ARIMA-modeller. I dette tilfellet antas en bevegelig gjennomsnittsmodell for dataene, og følgende konfidensbånd skal genereres: hvor k er lagret, N er prøvestørrelsen, z er den kumulative fordelingsfunksjonen til standard normalfordeling og (alfa) er betydningsnivået. I dette tilfellet øker konfidensbåndene etter hvert som laget øker. Autokorrelasjonsplottet kan gi svar på følgende spørsmål: Er data-tilfeldig Er en observasjon knyttet til en tilstøtende observasjon Er en observasjon knyttet til en observasjon to ganger fjernet (etc.) Er den observerte tidsserien hvit støy Er den observerte tidsserien sinusformet Er den observerte tidsserien autoregressiv Hva er en passende modell for de observerte tidsserier Er modellen gyldig og tilstrekkelig Er formelen ssqrt gyldig Viktighet: Sikre gyldigheten av ingeniørkonklusjoner Tilfeldighet (sammen med fast modell, fast variasjon og fast distribusjon) er En av de fire antagelsene som vanligvis ligger til grunn for alle måleprosesser. Tilfeldighetsforutsetningen er kritisk viktig av følgende tre grunner: De fleste standardstatistiske tester er avhengig av tilfeldighet. Gyldigheten av testkonklusjonene er direkte knyttet til gyldigheten av tilfeldighetsforutsetningen. Mange vanlige statistiske formler avhenger av tilfeldighetsforutsetningen, den vanligste formelen er formelen for å bestemme standardavviket til prøvens gjennomsnitt: hvor s er standardavviket til dataene. Selv om det er mye brukt, er resultatene fra å bruke denne formelen av ingen verdi med mindre tilfeldigheten antakelsen holder. For univariate data er standardmodellen Hvis dataene ikke er tilfeldige, er denne modellen feil og ugyldig, og estimatene for parametrene (for eksempel konstanten) blir usynlige og ugyldige. Kort sagt, hvis analytikeren ikke ser etter tilfeldighet, blir gyldigheten av mange av de statistiske konklusjonene mistenkt. Autocorrelation plot er en utmerket måte å sjekke for slik tilfeldighet.
No comments:
Post a Comment