Tidsserier & Kvantitativ analys inom finansiella system
Vårt globala finansiella system är ett av de mest komplexa system som existerar på vår jord.
Forskare har under flera decennier arbetat med att utveckla innovativa modeller för att förstå samband mellan olika faktorer och dess påverkan på finansiella tillgångar.
Intresset för att förutsäga komplexa systems framtida beteende är hög och fler och fler forskarteam nyttjar maskininlärning (ML) och djupinlärning (DL) för detta ändamål.
På NQ har vi gjort en översyn över ett antal forskningsrapporter avseende studier baserade på ML inom kvantanalysen av finansiella tidsserier. Vi kommer i ett antal följande blogginlägg presentera och jämföra olika studiers resultat.
Vad är då en tidsserie?
När data registreras med jämna mellanrum kallas det en tidsserie.
- Datauppsättningen har två dimensioner: tiden (oberoende variabel) och variabeln själv som beroende variabel.
Syftet med en prediktiv modell är att uppskatta värdet på en okänd variabel. En tidsserie har tid (t) som en oberoende variabel och en målberoende (target) variabel. Modellens utdata är det förväntade värdet för y vid tidpunkten t.
Tidsseriens komponenter
Tidsseriekomponenter är mycket viktiga för att analysera målvariabeln för att förstå dess beteende, vilka mönster den har och för att kunna välja lämplig tidsseriemodell.
Tidsseriekomponenter är nyckeln till att tolka tidsseriens beteende och för att analysera dess egenskaper samt identifiera möjliga samband.
Trend: Det finns en trend när en serie ökar, minskar eller förblir på en konstant nivå över tid.
Säsongsvariation: Detta avser egenskapen för en tidsserie som visar periodiska mönster som upprepas med konstant frekvens (m). Exempelvis kan man observera en säsongskomponent med m = 12, vilket innebär att det periodiska mönstret upprepas var tolfte månad.
Hypervariabler: På samma sätt som säsongsvariationer kan läggas till som binär funktion kan andra funktioner läggas till i binärt format till modellen. Man kan lägga till helgdagar, speciella evenemang, marknadsföringskampanjer mm. Man bör dock komma ihåg att dessa variabler måste ha bestämda mönster.
Många ML – algoritmer är inte optimala för tidsserier
En av de viktigaste egenskaperna som en algoritm behöver för att betraktas som en tidsseriealgoritm är förmågan att extrapolera mönster utanför domänen för träningsdata. Många ML algoritmer har inte den här funktionen, eftersom de tenderar att begränsas till en domän som definieras av träningsdata. Därför är de inte lämpade för tidsserier, eftersom målet med tidsserier är att projicera in i framtiden.
En annan viktig egenskap hos en tidsseriealgoritm är förmågan att härleda konfidensintervall. Även om detta är en standardegenskap för tidsseriemodeller, har de flesta maskininlärningsmodeller inte den här förmågan eftersom de inte alla baseras på traditionell statistisk distribution. Konfidensintervall kan uppskattas, men de kanske inte är lika exakta.
Tidiga modeller för analys av tidsserier
Under de senaste decennierna har forskare arbetat med flera system baserade på traditionella tillvägagångssätt, såsom exempelvis autoregressivt glidande medelvärde (ARIMA). Nackdelar med dessa traditionella metoder att de påvisar mindre bra prestanda när man hanterar en stor mängd data med hög komplexitet och multidimensionalitet. Dessa metoder är inte heller lämpliga för att förstå dolda, mönster, relationer (beroenden) mellan data. Klassiska studier har belyst svårigheten att studera ekonomiska tidsserier på ett korrekt sätt på grund av deras icke-linjära och icke-stationära mönster.
I denna artikel presenterade författarna en jämförande studie för att visa att vissa klassiska metoder är otillräckliga för att prognostisera utvecklingen av tidsserier. Studien diskuterar även fördelarna med att tillämpa maskininlärningstekniker på området kvantitativ analys inom finansiella system.
Klassiska tillvägagångssätt har dock framgångsrikt använts i stor utsträckning i stationära system, vilket representerar en approximation av de komplexa verkliga observationerna. Den progressiva automatiseringen av vissa processer och den snabba tekniska utvecklingen har lett till användning av ML-baserade metoder inom flera områden. Trots skepsis mot effektiviteten i dessa klassiska metoder för finansiella tidsserier har forskare visat att en av de främsta fördelarna av att använda ML är att kunna analysera en stor mängd data på kort tid med större noggrannhet och effektivitet.
Mer om detta i nästa blogginlägg.