Big data ja Weka API:n käyttö Java-sovelluksessa
Ahola, Annele (2016)
Ahola, Annele
Metropolia Ammattikorkeakoulu
2016
All rights reserved
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2016060111220
https://urn.fi/URN:NBN:fi:amk-2016060111220
Tiivistelmä
Tässä insinöörityössä esitellään lukijalle big data eli massadata ja sen louhinta sekä opastetaan, kuinka avoimen lähdekoodin tiedonlouhintasovellus Wekan tarjoamaa ohjelmointirajapintaa voidaan käyttää osana omaa koodia Java-sovelluksessa.
Työssä esitellään termi big data kaikessa monipuolisuudessaan. Samalla tutkitaan kuinka laajasti sitä voidaan ja kannattaa elämän eri osa-alueilla hyödyntää, jotta saavutetaan uutta tietoa ihmisistä ja heidän toiminnastaan, laitteista ja ympäristöstä sekä yleisesti syy-seuraussuhteista. Työssä esitellään haaste, jonka big data suurilla tietomäärillään sekä niiden jatkuvalla kasvulla ja monipuolistumisella asettaa yksityisille ihmisille, yrityksille ja yhteiskunnalle, sekä ratkaisut, joilla big data-analyysit sekä tiedonlouhinta vastaavat haasteeseen ja miten tämä käytännössä tapahtuu.
Ohjelmointirajapinnan käyttöönoton esittelyä varten on luotu sovellus, jonka tarkoituksena on numeerisia ennusteita hyödyntäen ennakoida vastaajan ikä hänen vastaustensa perusteella. Lisäksi ohjelma vertailee erilaisia numeerisen ennusteen menetelmiä toisiinsa tuoden esille niiden vahvuutta tai heikkoutta ennustamisessa. Lopuksi esitellään luotu sovellus ja ohjataan lukijaa askel askeleelta, kuinka se on toteutettu sekä rakennettu ja arvioidaan ohjelman toimintaa alkuperäisiä ohjelman toiminnan tavoitteita vasten.
Työssä esitellään termi big data kaikessa monipuolisuudessaan. Samalla tutkitaan kuinka laajasti sitä voidaan ja kannattaa elämän eri osa-alueilla hyödyntää, jotta saavutetaan uutta tietoa ihmisistä ja heidän toiminnastaan, laitteista ja ympäristöstä sekä yleisesti syy-seuraussuhteista. Työssä esitellään haaste, jonka big data suurilla tietomäärillään sekä niiden jatkuvalla kasvulla ja monipuolistumisella asettaa yksityisille ihmisille, yrityksille ja yhteiskunnalle, sekä ratkaisut, joilla big data-analyysit sekä tiedonlouhinta vastaavat haasteeseen ja miten tämä käytännössä tapahtuu.
Ohjelmointirajapinnan käyttöönoton esittelyä varten on luotu sovellus, jonka tarkoituksena on numeerisia ennusteita hyödyntäen ennakoida vastaajan ikä hänen vastaustensa perusteella. Lisäksi ohjelma vertailee erilaisia numeerisen ennusteen menetelmiä toisiinsa tuoden esille niiden vahvuutta tai heikkoutta ennustamisessa. Lopuksi esitellään luotu sovellus ja ohjataan lukijaa askel askeleelta, kuinka se on toteutettu sekä rakennettu ja arvioidaan ohjelman toimintaa alkuperäisiä ohjelman toiminnan tavoitteita vasten.