Hyppää sisältöön
    • Suomeksi
    • På svenska
    • In English
  • Suomi
  • Svenska
  • English
  • Kirjaudu
Hakuohjeet
JavaScript is disabled for your browser. Some features of this site may not work without it.
Näytä viite 
  •   Ammattikorkeakoulut
  • Tampereen ammattikorkeakoulu
  • Opinnäytetyöt (Käyttörajattu kokoelma)
  • Näytä viite
  •   Ammattikorkeakoulut
  • Tampereen ammattikorkeakoulu
  • Opinnäytetyöt (Käyttörajattu kokoelma)
  • Näytä viite

Whisper-mallin optimointi erikoistermien tunnistukseen

Virkkunen, Ilkka (2026)

 
Avaa tiedosto
Virkkunen_Ilkka.pdf (967.6Kt)
Lataukset: 

Rajattu käyttöoikeus / Restricted access / Tillgången är begränsad
Virkkunen, Ilkka
2026
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-202602042265
Tiivistelmä
Tämän opinnäytetyön tavoitteena oli parantaa esikoulutetun Whisper-puheentunnistusmallin suomenkielisen metsäalaan liittyvän erikoissanaston tunnistustarkkuutta. Työn tarkoituksena oli kehittää ja arvioida kohdennettu hienosäätöprosessi, jonka avulla yleiskielisellä aineistolla koulutettu automaattinen puheentunnistusmalli voidaan mukauttaa toimialakohtaiseen käyttöön. Opinnäytetyö toteutettiin kehittämistutkimuksellisella otteella yhteistyössä työn toimeksiantajan kanssa.

Tutkimuksessa tarkasteltiin kolmea tutkimuskysymystä: millä kehittämistoimenpiteillä Whisper-mallin erikoistermien tunnistusta voidaan parantaa, miten hienosäätö vaikuttaa mallin suorituskykyyn verrattuna esikoulutettuun malliin sekä voidaanko suppeasta erikoissanastosta muodostaa hienosäätöön soveltuva koulutusaineisto. Tulosten perusteella Whisper-mallin hienosäätö kohdennetulla aineistolla paransi mallin kykyä tunnistaa erikoissanastoa ja osoitti, että rajallisestakin lähtöaineistosta voidaan muodostaa tarkoituksenmukainen koulutusaineisto.

Opinnäytetyön tuotoksena syntyi automatisoitu ja toistettava koulutusputki, joka kattaa koulutusaineiston muodostamisen, augmentoinnin, annotoinnin, aineistonjaon, hyperparametrien optimoinnin sekä mallin hienosäädön ja arvioinnin. Tuotos vastaa toimeksiantajan tarpeeseen mahdollistamalla erikoissanaston tunnistuksen parantamisen kohdennetulla kehittämisratkaisulla.

Jatkokehityksenä suositellaan luonnollisen puheaineiston osuuden kasvattamista, laadullisen virheanalyysin syventämistä sekä ratkaisun testaamista muilla toimialakohtaisilla sanastoilla. Lisäksi käyttäjätestauksen hyödyntäminen voisi tukea ratkaisun käytännön toimivuuden arviointia.
 
Kokoelmat
  • Opinnäytetyöt (Käyttörajattu kokoelma)
Ammattikorkeakoulujen opinnäytetyöt ja julkaisut
Yhteydenotto | Tietoa käyttöoikeuksista | Tietosuojailmoitus | Saavutettavuusseloste
 

Selaa kokoelmaa

NimekkeetTekijätJulkaisuajatKoulutusalatAsiasanatUusimmatKokoelmat

Henkilökunnalle

Ammattikorkeakoulujen opinnäytetyöt ja julkaisut
Yhteydenotto | Tietoa käyttöoikeuksista | Tietosuojailmoitus | Saavutettavuusseloste