Äänenlaadun parantaminen neuroverkkojen avulla
Siltala, Niklas (2025)
Siltala, Niklas
2025
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2025052114078
https://urn.fi/URN:NBN:fi:amk-2025052114078
Tiivistelmä
Digitaalinen ääni, varsinkin pakattu tai peräisin vanhanaikaisista nauhoituksista, kärsii heikosta äänenlaadusta ja yksityiskohtien puutteesta. Tämän työn tavoitteena oli kehittää tekoälymalli (koneoppimismalli), joka kykeni parantamaan tällaista huonolaatuista ääntä. Erityisesti työssä pyrittiin palauttamaan äänenlaatu tilanteissa, joissa ääni oli heikentynyt digitaalisen prosessoinnin vuoksi. Työssä hyödynnettiin syväoppimismenetelmiä, erityisesti Generatiivisia Kilpailevia Verkkoja (GAN). Mallin kehittämiseen ja opettamiseen käytettiin monipuolista äänidataa erilaisista musiikin tyylilajeista, joiden äänenlaatua heikennettiin ohjelmallisesti. Työn tuloksena saatiin kehitettyä malli, joka kykeni havaittavasti parantamaan heikentynyttä äänenlaatua testatuilla aineistoilla. Esimerkiksi heikkolaatuisessa äänessä havaittiin selkeyden lisääntymistä ja yksityiskohtien palautumista verrattuna käsittelemättömään huonolaatuiseen ääneen. Ääniraidassa havaittiin selviä parannuksia, joita ei huonolaatuisessa äänessä ole. Työn perusteella voidaan todeta, että syväoppiminen ja erityisesti GAN- arkkitehtuurit ovat tehokkaita menetelmiä digitaalisesti heikentyneen äänenlaadun parantamiseen. Kehitetty malli osoittautuu lupaavaksi lähestymistavaksi äänen restaurointiin. Jatkokehitysehdotuksina esitetään mallin suorituskyvyn laajempaa arviointia erityyppisillä äänimateriaaleilla sekä reaaliaikaisen suorituskyvyn parantamista.