Suurten tietomassojen käsittely : Big Data
Mustonen, Minna-Sisko (2014)
Mustonen, Minna-Sisko
Oulun ammattikorkeakoulu
2014
All rights reserved
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2014080113366
https://urn.fi/URN:NBN:fi:amk-2014080113366
Tiivistelmä
Tämän opinnäytetyön tarkoituksena oli luoda tietopaketti tietojenkäsittelyn opiskelijoille suurten tieto-massojen käsittelyyn liittyen Big Datasta. Työn toimeksiantajana toimi Oulun ammattikorkeakoulu, Liiketalouden yksikkö.
Opinnäytetyön tarkoituksena oli selvittää ilmiötä Big Data kuten mitä se on, missä ja miten sitä syntyy ja miten ja missä sitä käytetään sekä käytettävistä menetelmistä. Työssä käytiin läpi käsitteet tiedon varastointi, tiedonlouhinta, tiedon analysointi ja tiedon jalostaminen. Big Data työvälineistä esiteltiin pintapuolisesti Hadoop ja sen tärkeimmät osaprojektit. Tietoturva ja yksityisyys kohdassa käsiteltiin läpi yksityisyydensuojaa ja henkilötietoihin liittyvää perusasiaa, jotka ovat tärkeä osa Big Data- ilmiötä. Työssä käytiin myös lyhyesti läpi pilvipalvelut ja miten ne liittyvät ilmiöön. Työn lopussa tarkasteltiin muutamien case- esimerkkien kautta miten ja missä Big Dataa käytetään Suomessa ja muualla maailmassa.
Tietoperustana työssä on käytetty aiheesta olevaa kirjallisuutta, elektronisia julkaisuja ja lehtiartikke-leita. Kaikki käytetyt lähteet liittyvät Big Dataan.
Työn tuloksena syntyi pienimuotoinen tietopaketti, jota voidaan käyttää aiheeseen tutustumisessa. Aihe osoittautui laajemmaksi kuin aluksi näytti. Aiheen laajuuden vuoksi osa-alueet on jouduttu ra-jaamaan suppeammiksi ja niitä ei ole voitu tarkastella tässä työssä syvällisemmin. Aihetta voitaisiin tarkastella yksityiskohtaisemmin eri työvälineiden kohdalta. Tietoturva, yksityisyys ja pilvipalvelut ovat myös aihealue jota voitaisiin tutkia laajemmin.
Opinnäytetyön tarkoituksena oli selvittää ilmiötä Big Data kuten mitä se on, missä ja miten sitä syntyy ja miten ja missä sitä käytetään sekä käytettävistä menetelmistä. Työssä käytiin läpi käsitteet tiedon varastointi, tiedonlouhinta, tiedon analysointi ja tiedon jalostaminen. Big Data työvälineistä esiteltiin pintapuolisesti Hadoop ja sen tärkeimmät osaprojektit. Tietoturva ja yksityisyys kohdassa käsiteltiin läpi yksityisyydensuojaa ja henkilötietoihin liittyvää perusasiaa, jotka ovat tärkeä osa Big Data- ilmiötä. Työssä käytiin myös lyhyesti läpi pilvipalvelut ja miten ne liittyvät ilmiöön. Työn lopussa tarkasteltiin muutamien case- esimerkkien kautta miten ja missä Big Dataa käytetään Suomessa ja muualla maailmassa.
Tietoperustana työssä on käytetty aiheesta olevaa kirjallisuutta, elektronisia julkaisuja ja lehtiartikke-leita. Kaikki käytetyt lähteet liittyvät Big Dataan.
Työn tuloksena syntyi pienimuotoinen tietopaketti, jota voidaan käyttää aiheeseen tutustumisessa. Aihe osoittautui laajemmaksi kuin aluksi näytti. Aiheen laajuuden vuoksi osa-alueet on jouduttu ra-jaamaan suppeammiksi ja niitä ei ole voitu tarkastella tässä työssä syvällisemmin. Aihetta voitaisiin tarkastella yksityiskohtaisemmin eri työvälineiden kohdalta. Tietoturva, yksityisyys ja pilvipalvelut ovat myös aihealue jota voitaisiin tutkia laajemmin.