Neuroverkkojen ja kielimallien hyödyntäminen osakekurssien ennustamisessa
Pulkkinen, Wille (2024)
Pulkkinen, Wille
2024
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-202403255139
https://urn.fi/URN:NBN:fi:amk-202403255139
Tiivistelmä
Insinöörityön tarkoituksena oli tarkastella GPT-4-kielimallin hyödyntämistä osakekurssien ennustamisessa LSTM-neuroverkkomallilla. Työssä keskityttiin Up/Down-ennustamismallin tekemiseen LSTM-neuroverkkomallilla, joka hyödynsi osakekurssidataa sekä GPT-4-kielimallin tekemiä analyysejä New York Timesin uutisteksteistä. Referenssinä GPT-4-kielimallin uutistekstianalyysiarvoille käytettiin tunnesanakirjapohjaisia sentimenttianalyysiarvoja samoista uutisteksteistä. Ennustamisen kohteeksi valittiin teknologiayhtiö Applen osakekurssin seuraavan päivän hinnanmuutoksen suunta.
Teoriaosuudessa käsiteltiin pintapuolisesti aiheeseen liittyvät oleellisimmat talouskäsitteet sekä ennustamisessa käytetyt teknologiat, kuten LSTM-neuroverkkomalli ja GPT-kielimallit sekä tärkeitä luonnollisen kielen käsittelytekniikoita.
Toteutusosiossa käytettiin New York Timesin avointa rajapintaa Apple-aiheisten uutisten hakemiseen viimeiseltä viideltä vuodelta Python-ohjelmointikielen avulla. Nämä uutistekstit käsiteltiin Python-ohjelmointikielellä OpenAI-yhtiön maksullisen rajapintapalvelun kautta hyödyntäen uusinta GPT-4-0125-preview-kielimallia. Sentimenttianalyysi samoista uutisteksteistä toteutettiin Python-ohjelmointikielellä Vader-mallin avulla. LSTM-malli konfiguroitiin ja koulutettiin Python-ohjelmointikielellä hyödyntäen Tensorflow.Keras-kirjastoa.
Tulosten katselmoinnissa ja johtopäätöksissä todettiin, että GPT-4-kielimallin tuottamaa dataa hyödyntävä LSTM-neuroverkkomalli oli toistuvasti keskimääräisesti hiukan tarkempi mitä referenssimallit. Pohdintaosuudessa mietittiin, mistä kyseiset erot voisivat johtua, jos ne eivät ole virhemarginaalin sisällä olevaa kohinaa. Lisäksi ehdotettiin jatkotutkimusideoita näiden tulosten pohjalta.
Teoriaosuudessa käsiteltiin pintapuolisesti aiheeseen liittyvät oleellisimmat talouskäsitteet sekä ennustamisessa käytetyt teknologiat, kuten LSTM-neuroverkkomalli ja GPT-kielimallit sekä tärkeitä luonnollisen kielen käsittelytekniikoita.
Toteutusosiossa käytettiin New York Timesin avointa rajapintaa Apple-aiheisten uutisten hakemiseen viimeiseltä viideltä vuodelta Python-ohjelmointikielen avulla. Nämä uutistekstit käsiteltiin Python-ohjelmointikielellä OpenAI-yhtiön maksullisen rajapintapalvelun kautta hyödyntäen uusinta GPT-4-0125-preview-kielimallia. Sentimenttianalyysi samoista uutisteksteistä toteutettiin Python-ohjelmointikielellä Vader-mallin avulla. LSTM-malli konfiguroitiin ja koulutettiin Python-ohjelmointikielellä hyödyntäen Tensorflow.Keras-kirjastoa.
Tulosten katselmoinnissa ja johtopäätöksissä todettiin, että GPT-4-kielimallin tuottamaa dataa hyödyntävä LSTM-neuroverkkomalli oli toistuvasti keskimääräisesti hiukan tarkempi mitä referenssimallit. Pohdintaosuudessa mietittiin, mistä kyseiset erot voisivat johtua, jos ne eivät ole virhemarginaalin sisällä olevaa kohinaa. Lisäksi ehdotettiin jatkotutkimusideoita näiden tulosten pohjalta.