Theseus käyttökatko ma 22.4. klo 12 alkaen. Katko jatkuu 22.4. klo 15 asti ja on koko Theseuksen laajuinen. Lisäksi töiden käsittely ja syöttö on estetty ti 23.4. ainakin klo 12 asti. Theseus service break from Mon 22.4. at 12:00. The break will last until 15:00 on Mon 22.4. and is Theseus-wide. In addition, processing and uploading of work will be blocked until at least 12:00 on Tue 23.4.
Koneoppimisen regressioalgoritmin soveltaminen Azure Machine Learning-palvelussa
Lindman, Pontus (2017)
Lindman, Pontus
Haaga-Helia ammattikorkeakoulu
2017
All rights reserved
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2017053111415
https://urn.fi/URN:NBN:fi:amk-2017053111415
Tiivistelmä
Tämän tutkimuksen aiheena oli selvittää miten koneoppimisen tekniikoita voi käyttää laskurin tuloksen laskemiseksi ilman työlästä perinteisten algoritmien kehittämistä manuaalisesti. Koneoppiminen laajempana ilmiönä tarjoaa mahdollisuuden löytää merkityksiä laajoista tietomassoista, joihin perinteisin menetelmin vastaava on vaatinut hyvin usein useamman vuoden kestävän kehitysprosessin. Pitkään nämä koneoppimisen menetelmät ovat olleet ainoastaan pidempään koneoppimista opiskelleiden asiantuntijoiden käytettävissä. Viimeisten vuosien aikana teknologiatoimittajat ja pilvipalvelujen tarjoajat ovat kuitenkin tuoneet markkinoille palveluja, joiden avulla koneoppimisen menetelmät ja teknologiat ovat helpommin kaikkien saatavilla.
Tutkimuksen ensimmäisessä osassa selvitetään mistä koneoppimisessa on kyse ja miten koneoppimista käyttävät tietotekniset ratkaisut toimivat käytännössä. Tässä osassa esitellään koneoppimisen vahvuuksia perinteisiin menetelmiin verrattuna, siihen liittyvä yleinen toimintaperiaate, ja pureudutaan syvemmin piirteiden suunnitteluun ja algoritmien käyttöön koneoppimisessa.
Tutkimuksen toisessa osassa tutustutaan CRISP-DM-menetelmään, joka on yleisin tiedonlouhinnan ja koneoppimisen prosessimalli. CRISP-DM-menetelmään kuuluu 6 vaihetta, joissa liiketoiminnan ymmärtämisen ja käytettävän datan ymmärtämisen kautta päästään julkaisemaan toimiva koneoppimisen malli sitä hyödyntäviin palveluihin ja sovelluksiin.
Tutkimuksen kokeet toteutettiin Azure Machine Learning palvelun avulla. Azure Machine Learning on MLaaS-tyyppinen pilvipalvelu, jossa ilman omille koneille asentamista voi suoraan kehittää koneoppimisen malleja ja toteuttaa erilaisia siihen liittyviä kokeita. Kappaleen alussa esitellään hyvän MLaaS-palvelun arviointikriteerejä ja verrataan miten hyvin tämä palvelu vastaa näihin kriteereihin. Kappaleen toisessa osassa esitellään itse palvelu ja sen koneoppimisen mallin kehittämisen kannalta olennaisimmat moduulit.
Työn käytännön osassa suoritin käytännön kokeena yleisesti tunnetun FINRISKI-laskurin toteuttamisen koneoppimisen keinoin CRISP-DM-menetelmän mukaisesti. Ensimmäisenä vaiheena tässä osuudessa oli selvittää ja kuvata laskurin toiminta, jonka jälkeen hain avoimista tietolähteistä tutkimukseen soveltuvaa aineistoa. Tutkimuksen aineistolle tein laadunvarmistuksen kahdessa vaiheessa tutkimuksessa kuvattujen menetelmien mukaisesti ja tällä aineistolla vertailin ja arvioin palvelun regressio-algoritmeja. Laatuvarmistetun datan ja soveltuvimman algoritmin avulla toteutin FINRISKI-laskurin ja varmistin sovellettavan menetelmän keinoin mallin toimivuuden. Lopuksi julkaisin opetetun mallin ulkopuolisten sovellusten käytettäväksi palvelun Web Services-rajapintojen avulla.
Tutkimuksen ensimmäisessä osassa selvitetään mistä koneoppimisessa on kyse ja miten koneoppimista käyttävät tietotekniset ratkaisut toimivat käytännössä. Tässä osassa esitellään koneoppimisen vahvuuksia perinteisiin menetelmiin verrattuna, siihen liittyvä yleinen toimintaperiaate, ja pureudutaan syvemmin piirteiden suunnitteluun ja algoritmien käyttöön koneoppimisessa.
Tutkimuksen toisessa osassa tutustutaan CRISP-DM-menetelmään, joka on yleisin tiedonlouhinnan ja koneoppimisen prosessimalli. CRISP-DM-menetelmään kuuluu 6 vaihetta, joissa liiketoiminnan ymmärtämisen ja käytettävän datan ymmärtämisen kautta päästään julkaisemaan toimiva koneoppimisen malli sitä hyödyntäviin palveluihin ja sovelluksiin.
Tutkimuksen kokeet toteutettiin Azure Machine Learning palvelun avulla. Azure Machine Learning on MLaaS-tyyppinen pilvipalvelu, jossa ilman omille koneille asentamista voi suoraan kehittää koneoppimisen malleja ja toteuttaa erilaisia siihen liittyviä kokeita. Kappaleen alussa esitellään hyvän MLaaS-palvelun arviointikriteerejä ja verrataan miten hyvin tämä palvelu vastaa näihin kriteereihin. Kappaleen toisessa osassa esitellään itse palvelu ja sen koneoppimisen mallin kehittämisen kannalta olennaisimmat moduulit.
Työn käytännön osassa suoritin käytännön kokeena yleisesti tunnetun FINRISKI-laskurin toteuttamisen koneoppimisen keinoin CRISP-DM-menetelmän mukaisesti. Ensimmäisenä vaiheena tässä osuudessa oli selvittää ja kuvata laskurin toiminta, jonka jälkeen hain avoimista tietolähteistä tutkimukseen soveltuvaa aineistoa. Tutkimuksen aineistolle tein laadunvarmistuksen kahdessa vaiheessa tutkimuksessa kuvattujen menetelmien mukaisesti ja tällä aineistolla vertailin ja arvioin palvelun regressio-algoritmeja. Laatuvarmistetun datan ja soveltuvimman algoritmin avulla toteutin FINRISKI-laskurin ja varmistin sovellettavan menetelmän keinoin mallin toimivuuden. Lopuksi julkaisin opetetun mallin ulkopuolisten sovellusten käytettäväksi palvelun Web Services-rajapintojen avulla.