Netezza-tietokannan taustajärjestelmän kehittäminen dbplyr-paketille
Kärkkäinen, Anni (2023)
Kärkkäinen, Anni
2023
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2023060117268
https://urn.fi/URN:NBN:fi:amk-2023060117268
Tiivistelmä
Nykypäivänä dataa on paljon tarjolla. Datan määrän sijaan ongelmana on enemmänkin sen säilöntä ja analysointi. Netezza on tietokantajärjestelmä, joka on suunnattu erityisesti suurille tietokannoille. dbplyr on taustajärjestelmä dplyrille, joka on R-kielelle saatava paketti. dplyr sisältää useita paljon käytettyjä funktioita datan hallintaan ja analysointiin. Se on erittäin paljon käytetty paketti R:llä.
dbplyrille on saatavilla taustajärjestelmiä lukuisille eri tietokannoille, mutta ei Netezzalle. dbplyriä tarvitaan, jotta dplyr ja tietokanta pystyvät kommunikoimaan keskenään. Tässä opinnäytetyössä on tehty taustajärjestelmä Netezzalle. Tässä esityksessä tutustutaan ensin R-kieleen, dplyriin, dbplyriin ja Netezzaan. Sen jälkeen esitetään, miten taustajärjestelmää lähdettiin tekemään ja miten se toteutettiin. Itse taustajärjestelmä toteutettiin R:llä. Lopuksi esitellään jatkotoimenpiteet työlle ja mahdolliset vaihtoehdot käytetyille järjestelmille, koska käytettävissä olevassa ajassa valmiiksi saadusta taustajärjestelmästä ei löydy ratkaisuja kaikille funktioille dplyrissä.
dbplyrille on saatavilla taustajärjestelmiä lukuisille eri tietokannoille, mutta ei Netezzalle. dbplyriä tarvitaan, jotta dplyr ja tietokanta pystyvät kommunikoimaan keskenään. Tässä opinnäytetyössä on tehty taustajärjestelmä Netezzalle. Tässä esityksessä tutustutaan ensin R-kieleen, dplyriin, dbplyriin ja Netezzaan. Sen jälkeen esitetään, miten taustajärjestelmää lähdettiin tekemään ja miten se toteutettiin. Itse taustajärjestelmä toteutettiin R:llä. Lopuksi esitellään jatkotoimenpiteet työlle ja mahdolliset vaihtoehdot käytetyille järjestelmille, koska käytettävissä olevassa ajassa valmiiksi saadusta taustajärjestelmästä ei löydy ratkaisuja kaikille funktioille dplyrissä.