Hyppää sisältöön
    • Suomeksi
    • På svenska
    • In English
  • Suomi
  • Svenska
  • English
  • Kirjaudu
Hakuohjeet
JavaScript is disabled for your browser. Some features of this site may not work without it.
Näytä viite 
  •   Ammattikorkeakoulut
  • Lapin ammattikorkeakoulu
  • Opinnäytetyöt (Käyttörajattu kokoelma)
  • Näytä viite
  •   Ammattikorkeakoulut
  • Lapin ammattikorkeakoulu
  • Opinnäytetyöt (Käyttörajattu kokoelma)
  • Näytä viite

GPT-mallien vertailu ja hienosäätö työohjeiden tueksi

Koskenniska, Mira; Riipi, Sanni (2025)

 
Avaa tiedosto
Koskenniska_Riipi.pdf (1.238Mt)
Lataukset: 

Rajattu käyttöoikeus / Restricted access / Tillgången är begränsad
Koskenniska, Mira
Riipi, Sanni
2025
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-202504156579
Tiivistelmä
Opinnäytetyössä tutkitaan kuinka tekoälyä voisi hyödyntää BRP Finland Oy:n toiminnassa työohjeiden tukena. Työ keskittyy vertailemaan GPT-malleja ja paneutuu GPT-mallin hienosäätöön. Työssä opetettiin esikoulutetulle kielimallille BRP:n suomenkielisiä työohjeita, jotka muunnettiin XLSX-tiedostosta kysymys-vastauspareiksi.

Opinnäytetyössä tutustutaan kielimalleihin, niiden koulutukseen ja hienosäätöön. Vertailussa perehdytään tarkemmin GPT-2-, GPT-3.5 Turbo-, LLaMA 3.2 3B- sekä Finnish GPT-3 Large -malleihin, ja näitä hienosäädetään omalla testiaineistolla. Näistä käyttöön valittiin Finnish GPT-3 Large -malli, joka hienosäädettiin toimeksiantajalta saadulla työohjeita sisältävällä testiaineistolla. Finnish GPT-3 -mallit mahdollistivat suljetun mallin luomisen, mikä oli tietoturvanäkökulmasta katsottuna keskeinen edellytys mallin valinnassa.

Työssä käytettiin koulun palvelinta, jossa oli kaksi NVIDIA Tesla A100 -grafiikkaprosessoria. Kehitysympäristönä toimi Jupyter Notebookia ja ohjelmointikielenä käytettiin Pythonia.

Tässä työssä saadut tulokset osoittavat, että GPT-mallia on mahdollista hyödyntää työohjeiden tukena hienosäätämällä sitä omalla aineistolla. Tuloksista havaittiin, että pelkkä pieni training loss -arvo ei takaa oikeiden vastausten saamista. Mallin suorituskykyyn vaikuttavat myös aineiston oikea muoto sekä se, että mallin ja aineiston koko ovat tasapainossa keskenään. Lisäksi tärkeää on huolellinen hienosäätö. Haasteita työssä aiheuttivat kielimallien suuresta koosta johtuvat resurssivaatimukset.
Kokoelmat
  • Opinnäytetyöt (Käyttörajattu kokoelma)
Ammattikorkeakoulujen opinnäytetyöt ja julkaisut
Yhteydenotto | Tietoa käyttöoikeuksista | Tietosuojailmoitus | Saavutettavuusseloste
 

Selaa kokoelmaa

NimekkeetTekijätJulkaisuajatKoulutusalatAsiasanatUusimmatKokoelmat

Henkilökunnalle

Ammattikorkeakoulujen opinnäytetyöt ja julkaisut
Yhteydenotto | Tietoa käyttöoikeuksista | Tietosuojailmoitus | Saavutettavuusseloste