Puheentunnistuksen mahdollisuudet sovellusten hallinnassa : Google-rajapinnan hyödyntäminen puheen tunnistamisessa
Happonen, Henri (2019)
Happonen, Henri
2019
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-201905067772
https://urn.fi/URN:NBN:fi:amk-201905067772
Tiivistelmä
Opinnäytetyön tavoitteena oli testata puheentunnistuksen ja syntetisoinnin mahdollisuuksia työn toimeksiantajalle Avenla Oy:lle. Avenla Oy tuottaa asiakkailleen räätälöityjä digitaalisen liiketoiminnan ja markkinoinnin palveluita, kuten ekstranet- ja intranet-toimintoja.
Puheentunnistuksella on suhteellisen pitkä historia, jo 60-luvulta lähtien, mutta viimeisen 10 vuoden aikana sen hyödyntäminen ja kehitys on lisääntynyt huomattavasti. Puheentunnistusta voidaan käyttää apuna esimerkiksi yksinkertaisten toimintojen suorittamisessa, joita ovat lait-teille luotavat hälytykset ja muistutusmerkinnät. Tämä mahdollistaa tietoteknisten laitteiden käytön ihmisille, joille niiden käyttö on haastavaa. Puheentunnistuksella voidaan myös tehos-taa erilaisten uusien älylaitteiden käyttöä.
Puheentunnistuksen ja syntetisoinnin testaamiseen käytettiin Googlen ilmaista puheentunnis-tusrajapintaa sekä Facebookin Wit.ai:n luonnollisen kielen prosessointialustaa (NLP). Googlen rajapinta toimii Javascript-koodin avulla Googlen Chrome-selaimessa. Wit.ai-rajapintaa voi käyttää useista eri ohjelmistoalustoista, kuten Javascriptin suoritukseen käytettävä Node JS. Rajapintaa voi myös käyttää verkkoselaiten ja serverien väliseen tiedonsiirtoon käytettyjen HTTP-pyyntöjen avulla. Wit.ai tunnistaa sille lähetetyistä viesteistä niiden merkityksen ja palaut-taa sen kutsuvalle sovellukselle.
Opinnäytetyön aikana kehitetyn sovelluksen tarkoitus oli testata puheentunnistuksen ja synteti-soinnin mahdollisuuksia jatkokehitystä varten. Luodun sovelluksen puheentunnistuksen tes-taaminen onnistui suhteellisen hyvin, mutta kehityksen aikana selvisi, ettei Googlen ilmainen rajapinta toimi työssä parhaalla mahdollisella tavalla, sillä se asettaa rajoituksia sovelluksen käytettävyyteen, koska rajapinnalla on täysi tuki ainoastaan Googlen Chrome selaimessa.
Puheentunnistuksella on suhteellisen pitkä historia, jo 60-luvulta lähtien, mutta viimeisen 10 vuoden aikana sen hyödyntäminen ja kehitys on lisääntynyt huomattavasti. Puheentunnistusta voidaan käyttää apuna esimerkiksi yksinkertaisten toimintojen suorittamisessa, joita ovat lait-teille luotavat hälytykset ja muistutusmerkinnät. Tämä mahdollistaa tietoteknisten laitteiden käytön ihmisille, joille niiden käyttö on haastavaa. Puheentunnistuksella voidaan myös tehos-taa erilaisten uusien älylaitteiden käyttöä.
Puheentunnistuksen ja syntetisoinnin testaamiseen käytettiin Googlen ilmaista puheentunnis-tusrajapintaa sekä Facebookin Wit.ai:n luonnollisen kielen prosessointialustaa (NLP). Googlen rajapinta toimii Javascript-koodin avulla Googlen Chrome-selaimessa. Wit.ai-rajapintaa voi käyttää useista eri ohjelmistoalustoista, kuten Javascriptin suoritukseen käytettävä Node JS. Rajapintaa voi myös käyttää verkkoselaiten ja serverien väliseen tiedonsiirtoon käytettyjen HTTP-pyyntöjen avulla. Wit.ai tunnistaa sille lähetetyistä viesteistä niiden merkityksen ja palaut-taa sen kutsuvalle sovellukselle.
Opinnäytetyön aikana kehitetyn sovelluksen tarkoitus oli testata puheentunnistuksen ja synteti-soinnin mahdollisuuksia jatkokehitystä varten. Luodun sovelluksen puheentunnistuksen tes-taaminen onnistui suhteellisen hyvin, mutta kehityksen aikana selvisi, ettei Googlen ilmainen rajapinta toimi työssä parhaalla mahdollisella tavalla, sillä se asettaa rajoituksia sovelluksen käytettävyyteen, koska rajapinnalla on täysi tuki ainoastaan Googlen Chrome selaimessa.