Whisper-mallin optimointi erikoistermien tunnistukseen
Virkkunen, Ilkka (2026)
Virkkunen, Ilkka
2026
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-202602042265
https://urn.fi/URN:NBN:fi:amk-202602042265
Tiivistelmä
Tämän opinnäytetyön tavoitteena oli parantaa esikoulutetun Whisper-puheentunnistusmallin suomenkielisen metsäalaan liittyvän erikoissanaston tunnistustarkkuutta. Työn tarkoituksena oli kehittää ja arvioida kohdennettu hienosäätöprosessi, jonka avulla yleiskielisellä aineistolla koulutettu automaattinen puheentunnistusmalli voidaan mukauttaa toimialakohtaiseen käyttöön. Opinnäytetyö toteutettiin kehittämistutkimuksellisella otteella yhteistyössä työn toimeksiantajan kanssa.
Tutkimuksessa tarkasteltiin kolmea tutkimuskysymystä: millä kehittämistoimenpiteillä Whisper-mallin erikoistermien tunnistusta voidaan parantaa, miten hienosäätö vaikuttaa mallin suorituskykyyn verrattuna esikoulutettuun malliin sekä voidaanko suppeasta erikoissanastosta muodostaa hienosäätöön soveltuva koulutusaineisto. Tulosten perusteella Whisper-mallin hienosäätö kohdennetulla aineistolla paransi mallin kykyä tunnistaa erikoissanastoa ja osoitti, että rajallisestakin lähtöaineistosta voidaan muodostaa tarkoituksenmukainen koulutusaineisto.
Opinnäytetyön tuotoksena syntyi automatisoitu ja toistettava koulutusputki, joka kattaa koulutusaineiston muodostamisen, augmentoinnin, annotoinnin, aineistonjaon, hyperparametrien optimoinnin sekä mallin hienosäädön ja arvioinnin. Tuotos vastaa toimeksiantajan tarpeeseen mahdollistamalla erikoissanaston tunnistuksen parantamisen kohdennetulla kehittämisratkaisulla.
Jatkokehityksenä suositellaan luonnollisen puheaineiston osuuden kasvattamista, laadullisen virheanalyysin syventämistä sekä ratkaisun testaamista muilla toimialakohtaisilla sanastoilla. Lisäksi käyttäjätestauksen hyödyntäminen voisi tukea ratkaisun käytännön toimivuuden arviointia.
Tutkimuksessa tarkasteltiin kolmea tutkimuskysymystä: millä kehittämistoimenpiteillä Whisper-mallin erikoistermien tunnistusta voidaan parantaa, miten hienosäätö vaikuttaa mallin suorituskykyyn verrattuna esikoulutettuun malliin sekä voidaanko suppeasta erikoissanastosta muodostaa hienosäätöön soveltuva koulutusaineisto. Tulosten perusteella Whisper-mallin hienosäätö kohdennetulla aineistolla paransi mallin kykyä tunnistaa erikoissanastoa ja osoitti, että rajallisestakin lähtöaineistosta voidaan muodostaa tarkoituksenmukainen koulutusaineisto.
Opinnäytetyön tuotoksena syntyi automatisoitu ja toistettava koulutusputki, joka kattaa koulutusaineiston muodostamisen, augmentoinnin, annotoinnin, aineistonjaon, hyperparametrien optimoinnin sekä mallin hienosäädön ja arvioinnin. Tuotos vastaa toimeksiantajan tarpeeseen mahdollistamalla erikoissanaston tunnistuksen parantamisen kohdennetulla kehittämisratkaisulla.
Jatkokehityksenä suositellaan luonnollisen puheaineiston osuuden kasvattamista, laadullisen virheanalyysin syventämistä sekä ratkaisun testaamista muilla toimialakohtaisilla sanastoilla. Lisäksi käyttäjätestauksen hyödyntäminen voisi tukea ratkaisun käytännön toimivuuden arviointia.