Historiallisen datan vaikutus LSTM-mallin tarkkuuteen osakekurssien ennustamisessa
Taajoranta, Atte (2025)
Taajoranta, Atte
2025
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2025111928635
https://urn.fi/URN:NBN:fi:amk-2025111928635
Tiivistelmä
Tässä opinnäytetyössä tutkittiin kuinka paljon historiallisella datalla on vaikutusta LSTM mallin ennustustarkkuuteen osakekursseja ennustaessa. Työssä kehitettiin LSTM-pohjainen neuroverkko malli, mille syötettiin eri määriä Nokian historiallista hintadataa nähdäksemme kuinka paljon se vaikuttaa ennustuksen tarkkuuteen. Ennusteen tarkkuutta verrattiin vuosien 2015-2025 todelliseen kurssiin.
Mallille syötettiin neljä eri pituista historiallista aikajaksoa: 1, 3, 5 ja 10 vuotta. Mallien ennusteita verrattiin toisiinsa ja todelliseen kurssin kehitykseen. Lisäksi mallien suorituskykyä arvioitiin virhemittareilla Mean Squared Error(MSE) ja Mean Absolute Error(MAE).
Tulosten perusteella suurempi määrä historiallista dataa parantaa mallin keskimääräistä tarkkuutta pidemmällä aikavälillä. Sen sijaan lyhyempi aikajakso mahdollisti pienempien markkinamuutosten ennustamisen, mutta heikensi pidemmän aikavälin ennustettavuutta.
Mallia voitaisiin jatkokehittää laajentamalla sen syötedataa sisältämään tarkempia tietoja osakekurssin päivittäisestä vaihtelusta, kuten korkeimmat ja alhaisimmat hinnat ja lisäämällä ulkoisia tekijöitä, kuten uutiset ja politiikka. Tämä auttaisi mallia paremmin ymmärtämään markkinoiden pieniä muutoksia, jotka saattavat vaikuttaa lähes satunnaisilta pelkien hintatietojen perusteella.
Mallille syötettiin neljä eri pituista historiallista aikajaksoa: 1, 3, 5 ja 10 vuotta. Mallien ennusteita verrattiin toisiinsa ja todelliseen kurssin kehitykseen. Lisäksi mallien suorituskykyä arvioitiin virhemittareilla Mean Squared Error(MSE) ja Mean Absolute Error(MAE).
Tulosten perusteella suurempi määrä historiallista dataa parantaa mallin keskimääräistä tarkkuutta pidemmällä aikavälillä. Sen sijaan lyhyempi aikajakso mahdollisti pienempien markkinamuutosten ennustamisen, mutta heikensi pidemmän aikavälin ennustettavuutta.
Mallia voitaisiin jatkokehittää laajentamalla sen syötedataa sisältämään tarkempia tietoja osakekurssin päivittäisestä vaihtelusta, kuten korkeimmat ja alhaisimmat hinnat ja lisäämällä ulkoisia tekijöitä, kuten uutiset ja politiikka. Tämä auttaisi mallia paremmin ymmärtämään markkinoiden pieniä muutoksia, jotka saattavat vaikuttaa lähes satunnaisilta pelkien hintatietojen perusteella.
