Python-pohjaiset datan visualisointityökalut
Robert, Vesterinen (2019)
Robert, Vesterinen
2019
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2019053013403
https://urn.fi/URN:NBN:fi:amk-2019053013403
Tiivistelmä
Data-analytiikan sekä datan visualisoinnin osaamisen kysyntä on kasvanut viime vuosina nopeaa vauhtia. Useat yritykset ovat havahtuneet siihen, että niiden tietokantoihin varastoitua pimeää dataa voidaan käyttää hyväksi mm. liiketoimintamallien kehittämisessä. Tämän datan hyödyntäminen vaatii ymmärrystä tiedon jalostamisesta sekä sen esittämisestä muodossa, jonka pohjalta sitä voidaan analysoida tehokkaasti. Datan esittämisen teoria, visualisointityökalut sekä jalostus ovat tämän kysynnän keskiössä.
Termit kuten Open Source, Big Data ja data-driven decision making ovat olleet olennainen osa data-analytiikkaan liittyvää sanastoa. Millä keinoin pimeää dataa saadaan käytännössä hyödynnettyä? Python-pohjaiset datan visualisointityökalut ovat olleet laajasti käytössä niiden monipuolisten ominaisuuksien, joustavuuden sekä avoimen lähdekoodin vuoksi. Näitä työkaluja on suuri määrä, joten uudelle käyttäjälle ongelmakohdaksi usein muodostuu työkalun valinta.
Tavoitteena oli tutkia Python-pohjaisten visualisointityökalujen ominaisuuksia käyttämällä hyväksi avoimia datajoukkoja. Tämän vertailevan tutkimuksen pohjalta muodostettiin johtopäätökset työkalujen ominaisvahvuuksista, jota hyväksikäyttämällä perusteltiin työkalun valinta toimeksiantajan toimittaman lähdedatan visualisointia varten. Visualisoinnin luominen pohjautui teoriaosuudessa läpikäytyyn materiaaliin liittyen ihmisen havaintokykyyn sekä graafisen esittämisen hyviin käytänteisiin. Lopputuloksena saatiin luotua interaktiivinen työpöytäsovellus aikasarjatyyppisen lähdedatan analysointia varten. The expertise related to data-analytics and data visualization has been in increasingly high demand for the last few years. Many corporations have become aware that the “dark” data which is stored in their databases can be used to improve their business model. The utilization of this data requires a good comprehension of data processing and data presentation in the format that it can be analyzed effectively. The competence in data visualization theory, tools and processing is in the center of this increasing demand.
Terms as Open Source, Big Data and data-driven decision making have been an essential part of data-analytics vocabulary. How can this dark data be utilized in practice? Python -programming language-based data visualization libraries have been widely used because of the versatile features, flexibility and open source code. There are a great number of these Python -tools so a new problem arises for a new user who has entered this do-main; what tool should be used?
The object was to explore the functionalities of these libraries using public datasets. Based on this comparative research method a conclusion was formed about the capabili-ties of these tools which was then used to determine what tool was the best for visualiz-ing a dataset supplied by the client. The creation of the visualization was based on the material which was covered in the theoretical part of this assignment related to human perception and data visualization best practices. The result was a complete interactive desktop application which could be used to analyze the given dataset.
Termit kuten Open Source, Big Data ja data-driven decision making ovat olleet olennainen osa data-analytiikkaan liittyvää sanastoa. Millä keinoin pimeää dataa saadaan käytännössä hyödynnettyä? Python-pohjaiset datan visualisointityökalut ovat olleet laajasti käytössä niiden monipuolisten ominaisuuksien, joustavuuden sekä avoimen lähdekoodin vuoksi. Näitä työkaluja on suuri määrä, joten uudelle käyttäjälle ongelmakohdaksi usein muodostuu työkalun valinta.
Tavoitteena oli tutkia Python-pohjaisten visualisointityökalujen ominaisuuksia käyttämällä hyväksi avoimia datajoukkoja. Tämän vertailevan tutkimuksen pohjalta muodostettiin johtopäätökset työkalujen ominaisvahvuuksista, jota hyväksikäyttämällä perusteltiin työkalun valinta toimeksiantajan toimittaman lähdedatan visualisointia varten. Visualisoinnin luominen pohjautui teoriaosuudessa läpikäytyyn materiaaliin liittyen ihmisen havaintokykyyn sekä graafisen esittämisen hyviin käytänteisiin. Lopputuloksena saatiin luotua interaktiivinen työpöytäsovellus aikasarjatyyppisen lähdedatan analysointia varten.
Terms as Open Source, Big Data and data-driven decision making have been an essential part of data-analytics vocabulary. How can this dark data be utilized in practice? Python -programming language-based data visualization libraries have been widely used because of the versatile features, flexibility and open source code. There are a great number of these Python -tools so a new problem arises for a new user who has entered this do-main; what tool should be used?
The object was to explore the functionalities of these libraries using public datasets. Based on this comparative research method a conclusion was formed about the capabili-ties of these tools which was then used to determine what tool was the best for visualiz-ing a dataset supplied by the client. The creation of the visualization was based on the material which was covered in the theoretical part of this assignment related to human perception and data visualization best practices. The result was a complete interactive desktop application which could be used to analyze the given dataset.