Datan laadun merkitys koneoppimisessa

Partanen, Panu

Datan laadun merkitys koneoppimisessa

Partanen, Panu (2019)

Avaa tiedosto

Thesis_Panu_Partanen_Datan_laadun_merkitys_koneoppimisessa.pdf (1.098Mt)

Lataukset:

Partanen, Panu

2019

Näytä kaikki kuvailutiedot

Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2019053013415

Tiivistelmä

Opinnäytetyössä käsiteltiin koneoppimisen teoriaa ja datan laadun tärkeyttä neuroverkkojen koulutusprosessissa. Tehtävänä oli selvittää asiakkaan työntekijöiden tehtävän kesto käyttämällä koneoppimisenmenetelmiä ja hyödyntämällä yrityksen keräämää tietoa työntekijöiden työtehtävistä. Tavoitteena oli toteuttaa prototyyppi, jonka tarkoituksena oli ennustaa tulevien tehtävien keston pituus, jotta asiakkaan yrityksen toiminnan eri vaiheita voitaisiin nopeuttaa ja vähentää syntynyttä hukka-aikaa. Tavoitteena oli myös valita sopiva teknologia, joka soveltuisi prototyypin toteutukseen. Teoreettisessa viitekehyksessä tutkittiin koneoppimisen eri osa-alueita ja vaiheita. Työssä keskityttiin koneoppimisen oppimistyyleihin, neuroverkkojen rakenteeseen ja eri tyyppeihin sekä datan keräämiseen ja analysointiin. Toteutuksessa käytiin vaiheittain läpi datan esikäsittely- ja normalisointiprosessi sekä neuroverkon luonti ja kouluttaminen valitulla teknologialla. Lopputuloksena prototyyppi ei onnistunut ennustamaan tehtävän kestoa riittävän tarkasti, jotta sitä voisi hyödyntää konkreettisesti käytännössä. Koulutetun neuroverkon ulostulo ei vastannut syötettyihin tietoihin, koska prototyypissä hyödynnetty data oli huonolaatuista. Yritykselle saatiin kuitenkin tuotua lisäarvoa selvittämällä datan keräämisen ongelmakohtia ja samalla toteutuksessa saatiin todistettua datan laadun merkitys koneoppimisessa.

Kokoelmat

Opinnäytetyöt (Avoin kokoelma)