Tekoälyä hyödyntävä puhesynteesi-Discord-botti
Hytönen, Santeri (2024)
Hytönen, Santeri
2024
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2024111227917
https://urn.fi/URN:NBN:fi:amk-2024111227917
Tiivistelmä
Insinöörityössä kehitettiin tekoälyä hyödyntävä puhesynteesi-Discord-botti. Botin tarkoitus oli ottaa käyttäjiltä kehotteita tekstimuodossa ja muuttaa ne puheeksi. Discord-botissa hyödynnettiin Elevenlabs-palvelun puhesynteesiteknologiaa rajapintakutsuin. Luodut puhesynteesiäänitiedostot tallennettiin paikalliseen hakemistoon, ja niitä suodatettiin tietokannan avulla.
Puhesynteesin käyttö tapahtui valitsemalla haluttu kielimalli ja antamalla kehote. Discord-botti teki annetun kehotteen perusteella rajapintakutsun Elevenlabs-palveluun, jossa puhesynteesi luotiin. Luomisen jälkeen puhesynteesitiedosto toistettiin Discord-puhekanavalla ja tallennettiin paikalliseen hakemistoon. Tallennuksen yhteydessä puhesynteesistä lisättiin tietue tietokantaan, jotta se voitiin toistaa myöhemmin tarvittaessa uudestaan. Elevenlabs-palvelusta käytettiin Starter-tason tilausta.
Discord-keskustelualustalle on mahdollista rakentaa omia automatisoituja ohjelmistoja. Nämä automatisoidut ohjelmistot eli botit voidaan laittaa vastaanottamaan komentoja ja toimimaan niiden mukaan. Insinöörityössä botilla oli käyttäjäystävälliset komennot puhesynteesien luomiseen ja jo luotujen puhesynteesien toistamiseen.
Lopputuloksena saatiin paikallisella laitteella toimiva Discord-botti, jolla oli helppokäyttöiset komennot puhesynteesien luomiseen ja toistamiseen. Botti osasi hyödyntää tietokantaa aikaisemmin luotujen äänitiedostojen suodattamiseksi ja toistaa äänitiedostoja käyttäjän tai kielimallin nimen perusteella.
Puhesynteesin käyttö tapahtui valitsemalla haluttu kielimalli ja antamalla kehote. Discord-botti teki annetun kehotteen perusteella rajapintakutsun Elevenlabs-palveluun, jossa puhesynteesi luotiin. Luomisen jälkeen puhesynteesitiedosto toistettiin Discord-puhekanavalla ja tallennettiin paikalliseen hakemistoon. Tallennuksen yhteydessä puhesynteesistä lisättiin tietue tietokantaan, jotta se voitiin toistaa myöhemmin tarvittaessa uudestaan. Elevenlabs-palvelusta käytettiin Starter-tason tilausta.
Discord-keskustelualustalle on mahdollista rakentaa omia automatisoituja ohjelmistoja. Nämä automatisoidut ohjelmistot eli botit voidaan laittaa vastaanottamaan komentoja ja toimimaan niiden mukaan. Insinöörityössä botilla oli käyttäjäystävälliset komennot puhesynteesien luomiseen ja jo luotujen puhesynteesien toistamiseen.
Lopputuloksena saatiin paikallisella laitteella toimiva Discord-botti, jolla oli helppokäyttöiset komennot puhesynteesien luomiseen ja toistamiseen. Botti osasi hyödyntää tietokantaa aikaisemmin luotujen äänitiedostojen suodattamiseksi ja toistaa äänitiedostoja käyttäjän tai kielimallin nimen perusteella.
