Whisper-mallin optimointi erikoistermien tunnistukseen

Virkkunen, Ilkka

Whisper-mallin optimointi erikoistermien tunnistukseen

Virkkunen, Ilkka (2026)

Avaa tiedosto

Virkkunen_Ilkka.pdf (967.6Kt)

Lataukset:

Rajattu käyttöoikeus / Restricted access / Tillgången är begränsad

Virkkunen, Ilkka

2026

Näytä kaikki kuvailutiedot

Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-202602042265

Tiivistelmä

Tämän opinnäytetyön tavoitteena oli parantaa esikoulutetun Whisper-puheentunnistusmallin suomenkielisen metsäalaan liittyvän erikoissanaston tunnistustarkkuutta. Työn tarkoituksena oli kehittää ja arvioida kohdennettu hienosäätöprosessi, jonka avulla yleiskielisellä aineistolla koulutettu automaattinen puheentunnistusmalli voidaan mukauttaa toimialakohtaiseen käyttöön. Opinnäytetyö toteutettiin kehittämistutkimuksellisella otteella yhteistyössä työn toimeksiantajan kanssa.

Tutkimuksessa tarkasteltiin kolmea tutkimuskysymystä: millä kehittämistoimenpiteillä Whisper-mallin erikoistermien tunnistusta voidaan parantaa, miten hienosäätö vaikuttaa mallin suorituskykyyn verrattuna esikoulutettuun malliin sekä voidaanko suppeasta erikoissanastosta muodostaa hienosäätöön soveltuva koulutusaineisto. Tulosten perusteella Whisper-mallin hienosäätö kohdennetulla aineistolla paransi mallin kykyä tunnistaa erikoissanastoa ja osoitti, että rajallisestakin lähtöaineistosta voidaan muodostaa tarkoituksenmukainen koulutusaineisto.

Opinnäytetyön tuotoksena syntyi automatisoitu ja toistettava koulutusputki, joka kattaa koulutusaineiston muodostamisen, augmentoinnin, annotoinnin, aineistonjaon, hyperparametrien optimoinnin sekä mallin hienosäädön ja arvioinnin. Tuotos vastaa toimeksiantajan tarpeeseen mahdollistamalla erikoissanaston tunnistuksen parantamisen kohdennetulla kehittämisratkaisulla.

Jatkokehityksenä suositellaan luonnollisen puheaineiston osuuden kasvattamista, laadullisen virheanalyysin syventämistä sekä ratkaisun testaamista muilla toimialakohtaisilla sanastoilla. Lisäksi käyttäjätestauksen hyödyntäminen voisi tukea ratkaisun käytännön toimivuuden arviointia.

Kokoelmat

Opinnäytetyöt (Käyttörajattu kokoelma)