Machine learning ja data science -ratkaisut OpenShiftissä
Stenman, Vilho (2018)
Stenman, Vilho
Tampereen ammattikorkeakoulu
2018
All rights reserved
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2018121822184
https://urn.fi/URN:NBN:fi:amk-2018121822184
Tiivistelmä
Opinnäytetyössä selvitettiin, kuinka saada data science ja machine learning toteutuksia ajettua OpenShiftin päällä mahdollisimman helposti. OpenShiftiä oli alunperin tarkoitus käyttää toimeksiantajan ympäristössä, mutta opinnäytetyön aikana ympäristöksi vaihdettiin lokaalisti asennettava OpenShift. Ympäristönvaihdos suoritettiin useiden eri machine learning ja data science -ratkaisuiden asennusten epäonnistuttua OpenShiftin käyttöoikeuksien vuoksi. Opinnäytetyön toimeksiantaja on Ambientia Oy, joka toimii ohjelmistoalalla räätälöityjen ohjelmistotopalveluiden toteuttajana, sekä konsultointipalveluiden ja Atlassian-lisenssien ja -palveluiden toimittajana.
Opinnäytetyössä selvitettiin, kuinka TensorFlowin ja Apache Sparkin asentaminen ja käyttöönotto tapahtuu OpenShiftissä. TensorFlow ja Apache Spark ovat avoimen lähdekoodin koneoppimis- ja datatiedesovelluksia. Opinnäytetyössä tutkittiin, kuinka kyseiset ratkaisut toimivat OpenShiftissä ja pohdittiin sekä vertailtiin näiden ratkaisuiden ominaisuuksia ja toiminnallisuuksia. Opinnäytetyössä pohdittiin myös infrastruktuurin perustamisen vaivaa ja yksityisen pilven skaalautuvuutta verrattuna julkisen pilven rajattomaan skaalautuvuuteen.
Koneoppiminen ja datatiede kasvavat tällä hetkellä nopeasti ja valtaavat lisää markkinaosuutta. Opinnäytetyössä perehdyttiin tarkemmin siihen, mitä koneoppiminen ja datatiede ovat ja mitä kaikkea niillä voidaan tehdä ja saada aikaan.
Opinnäytetyössä selvitettiin, kuinka TensorFlowin ja Apache Sparkin asentaminen ja käyttöönotto tapahtuu OpenShiftissä. TensorFlow ja Apache Spark ovat avoimen lähdekoodin koneoppimis- ja datatiedesovelluksia. Opinnäytetyössä tutkittiin, kuinka kyseiset ratkaisut toimivat OpenShiftissä ja pohdittiin sekä vertailtiin näiden ratkaisuiden ominaisuuksia ja toiminnallisuuksia. Opinnäytetyössä pohdittiin myös infrastruktuurin perustamisen vaivaa ja yksityisen pilven skaalautuvuutta verrattuna julkisen pilven rajattomaan skaalautuvuuteen.
Koneoppiminen ja datatiede kasvavat tällä hetkellä nopeasti ja valtaavat lisää markkinaosuutta. Opinnäytetyössä perehdyttiin tarkemmin siihen, mitä koneoppiminen ja datatiede ovat ja mitä kaikkea niillä voidaan tehdä ja saada aikaan.