fast.ai-ohjelmistokirjastoon pohjautuvan koneoppimismallin kouluttaminen avoimella ajoneuvo- ja aluedatalla
Killström, Eeli (2023)
Killström, Eeli
2023
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2023060217406
https://urn.fi/URN:NBN:fi:amk-2023060217406
Tiivistelmä
Tämän opinnäytetyön tavoitteena oli kuvata fastai-kirjaston sekä alue- ja ajoneuvodatan avulla ajoneuvojen käyttäjiä luokittelevan koneoppimismallin kehitysprosessia. Koneoppimismallin kehittämisessä käytettiin käyttötarkoitukseen osittain sopimatonta avointa dataa, minkä takia opinnäytetyössä painotetaan kehitysprosessin ohella vain mallin yleistä toimintaa ilman ennustetarkkuuden yksityiskohtaisempaa analysointia.
Opinnäytetyön teoriaosuuksissa käsitellään fastai-kirjaston lisäksi yleisimpiä koneoppimismallien kehitykseen käytettäviä kirjastoja. Teoriaosuudessa ja opinnäytetyön rakenteessa huomioidaan koneoppimismallin kehitysprosessin osa-alueet, jotka on opinnäytetyössä jaoteltu osittain päällekkäisiin, datan käsittelystä, mallin kouluttamisesta ja mallin käyttämisestä koostuviin vaiheisiin.
Datan käsittelyyn liittyen opinnäytetyössä käydään ensin läpi avointen datalähteiden lisäksi alue- ja ajoneuvodatan sisältöä sekä muotoa. pandas-kirjastoon perustuvaa datan käytännön käsittelyä havainnollistetaan Jupyter Notebook -ohjelmiston selainkäyttöliittymän visuaalisten taulukoiden kautta.
Mallin kouluttamista ja datan käsittelemistä yhdistelevässä, fastai-kirjaston käyttöä käsittelevässä osiossa perehdytään fastai-luokkien käytännön toimintaan sekä käsitellyn datan sovittamiseen fastai-olioihin.
Kehitysprosessin viimeisessä, mallin käyttämistä koskevassa osiossa tarkastellaan sitä, miten käsitellyn datan pohjalta luodulla koneoppimismallilla voidaan tehdä ennusteita. Ennusteita ja mallin toimintaa myös analysoidaan pintapuolisesti.
Opinnäytetyön lopussa pohditaan kunkin kehitysprosessin vaiheen onnistumista sekä mahdollisia jatkokehityskohteita.
Opinnäytetyön teoriaosuuksissa käsitellään fastai-kirjaston lisäksi yleisimpiä koneoppimismallien kehitykseen käytettäviä kirjastoja. Teoriaosuudessa ja opinnäytetyön rakenteessa huomioidaan koneoppimismallin kehitysprosessin osa-alueet, jotka on opinnäytetyössä jaoteltu osittain päällekkäisiin, datan käsittelystä, mallin kouluttamisesta ja mallin käyttämisestä koostuviin vaiheisiin.
Datan käsittelyyn liittyen opinnäytetyössä käydään ensin läpi avointen datalähteiden lisäksi alue- ja ajoneuvodatan sisältöä sekä muotoa. pandas-kirjastoon perustuvaa datan käytännön käsittelyä havainnollistetaan Jupyter Notebook -ohjelmiston selainkäyttöliittymän visuaalisten taulukoiden kautta.
Mallin kouluttamista ja datan käsittelemistä yhdistelevässä, fastai-kirjaston käyttöä käsittelevässä osiossa perehdytään fastai-luokkien käytännön toimintaan sekä käsitellyn datan sovittamiseen fastai-olioihin.
Kehitysprosessin viimeisessä, mallin käyttämistä koskevassa osiossa tarkastellaan sitä, miten käsitellyn datan pohjalta luodulla koneoppimismallilla voidaan tehdä ennusteita. Ennusteita ja mallin toimintaa myös analysoidaan pintapuolisesti.
Opinnäytetyön lopussa pohditaan kunkin kehitysprosessin vaiheen onnistumista sekä mahdollisia jatkokehityskohteita.