Datan laadun merkitys koneoppimisessa
Partanen, Panu (2019)
Partanen, Panu
2019
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2019053013415
https://urn.fi/URN:NBN:fi:amk-2019053013415
Tiivistelmä
Opinnäytetyössä käsiteltiin koneoppimisen teoriaa ja datan laadun tärkeyttä neuroverkkojen koulutusprosessissa. Tehtävänä oli selvittää asiakkaan työntekijöiden tehtävän kesto käyttämällä koneoppimisenmenetelmiä ja hyödyntämällä yrityksen keräämää tietoa työntekijöiden työtehtävistä. Tavoitteena oli toteuttaa prototyyppi, jonka tarkoituksena oli ennustaa tulevien tehtävien keston pituus, jotta asiakkaan yrityksen toiminnan eri vaiheita voitaisiin nopeuttaa ja vähentää syntynyttä hukka-aikaa. Tavoitteena oli myös valita sopiva teknologia, joka soveltuisi prototyypin toteutukseen. Teoreettisessa viitekehyksessä tutkittiin koneoppimisen eri osa-alueita ja vaiheita. Työssä keskityttiin koneoppimisen oppimistyyleihin, neuroverkkojen rakenteeseen ja eri tyyppeihin sekä datan keräämiseen ja analysointiin. Toteutuksessa käytiin vaiheittain läpi datan esikäsittely- ja normalisointiprosessi sekä neuroverkon luonti ja kouluttaminen valitulla teknologialla. Lopputuloksena prototyyppi ei onnistunut ennustamaan tehtävän kestoa riittävän tarkasti, jotta sitä voisi hyödyntää konkreettisesti käytännössä. Koulutetun neuroverkon ulostulo ei vastannut syötettyihin tietoihin, koska prototyypissä hyödynnetty data oli huonolaatuista. Yritykselle saatiin kuitenkin tuotua lisäarvoa selvittämällä datan keräämisen ongelmakohtia ja samalla toteutuksessa saatiin todistettua datan laadun merkitys koneoppimisessa.