BigQuery ML : koneoppimismallien luominen standardisoidulla SQL-syntaksilla
Juuti, Peetu (2020)
Juuti, Peetu
2020
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-202004235693
https://urn.fi/URN:NBN:fi:amk-202004235693
Tiivistelmä
Tämän opinnäytetyön tavoitteena oli perehtyä BigQuery ML -alustan käyttöön ja tutkia sen toimivuutta ja ominaisuuksia koneoppimistyökaluna. Työssä pohditaan myös alustan hyödyllisyyttä ja sen käyttömahdollisuuksia liiketoiminnan näkökulmasta.
Koneoppiminen vaatii tekijältä ohjelmointitaitoa ja koneoppimistyökalujen osaamista. Tämä rajoittaa ratkaisukehityksen yrityksessä vain pienelle henkilömäärälle, mikä ei välttämättä ole kovin tehokasta tai tuotteliasta liiketoiminnan kannalta. BigQuery ML -koneoppimistyökalun tarkoituksena on antaa data-analytiikoille tai muille SQL-ammatinharjoittajille mahdollisuus tehdä koneoppimismalleja valmiiksi olemassa olevalla tietotaidolla.
Opinnäytetyössä tutkitaan alustan kokonaisuutta ja sen koneoppimisympäristöä sekä niihin liittyvää dokumentaatiota ja algoritmien selityksiä. Työssä käsitellään koneoppimistyöprosessin eri vaiheet tutkimalla, analysoimalla ja mallintamalla dataa käyttämällä prosessissa BigQueryä keskitettynä datavarastona ja koneoppimismallien luomisalustana. Työssä tutustutaan myös yleisesti datatieteen, koneoppimisen ja muiden aiheeseen liittyvien osa-alueiden käsitteisiin, työprosesseihin ja käyttötapoihin. Työprosesseja ja käyttötapoja havainnollistetaan työssä visualisoivilla kuvilla ja esimerkeillä.
Työn tuloksissa tuodaan esille BigQueryn hyötyjä ja esitetään sen koneoppimisympäristön etuja sekä puutteita. Kehitysehdotuksena
koneoppimistyöprosessissa voitaisiin käyttää lähtökohtaisesti BigQueryä, mutta soveltaa muita koneoppimistyökaluja tarpeen mukaan.
Koneoppiminen vaatii tekijältä ohjelmointitaitoa ja koneoppimistyökalujen osaamista. Tämä rajoittaa ratkaisukehityksen yrityksessä vain pienelle henkilömäärälle, mikä ei välttämättä ole kovin tehokasta tai tuotteliasta liiketoiminnan kannalta. BigQuery ML -koneoppimistyökalun tarkoituksena on antaa data-analytiikoille tai muille SQL-ammatinharjoittajille mahdollisuus tehdä koneoppimismalleja valmiiksi olemassa olevalla tietotaidolla.
Opinnäytetyössä tutkitaan alustan kokonaisuutta ja sen koneoppimisympäristöä sekä niihin liittyvää dokumentaatiota ja algoritmien selityksiä. Työssä käsitellään koneoppimistyöprosessin eri vaiheet tutkimalla, analysoimalla ja mallintamalla dataa käyttämällä prosessissa BigQueryä keskitettynä datavarastona ja koneoppimismallien luomisalustana. Työssä tutustutaan myös yleisesti datatieteen, koneoppimisen ja muiden aiheeseen liittyvien osa-alueiden käsitteisiin, työprosesseihin ja käyttötapoihin. Työprosesseja ja käyttötapoja havainnollistetaan työssä visualisoivilla kuvilla ja esimerkeillä.
Työn tuloksissa tuodaan esille BigQueryn hyötyjä ja esitetään sen koneoppimisympäristön etuja sekä puutteita. Kehitysehdotuksena
koneoppimistyöprosessissa voitaisiin käyttää lähtökohtaisesti BigQueryä, mutta soveltaa muita koneoppimistyökaluja tarpeen mukaan.