Avoimen datan hyödyntäminen ja visualisointi
Leinonen, Anton (2022)
Leinonen, Anton
2022
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2022121228140
https://urn.fi/URN:NBN:fi:amk-2022121228140
Tiivistelmä
Avoin data on julkista tietoa, joka on kenen tahansa käytettävissä mihin tahansa tarkoitukseen. Avoin data on internetissä kokonaisena, ilmaisena ja koneluettavana. Data on avointa, jos sillä on jokin avoimen hyödyntämisen lisenssi, kuten Creative Commons BY 4.0 eli ”nimi mainittava” -lisenssi.
Datan visualisointi on tiedon esittämistä graafisessa muodossa. Datan visualisointi on erinomainen tapa esittää tietoa helposti ymmärrettävästi ei-tekniselle yleisölle. Kaikesta rakenteellisesta datasta voi tehdä visualisointeja.
Tämän opinnäytetyön tarkoituksena oli selvittää, mitä on avoin data, millaisia visualisointikeinoja on olemassa ja mitkä visualisoinnit sopivat eri datan esittämiseen.
Työssä visualisoitiin Suomen kuuden suurimman kaupungin päihde- ja mielenterveyspalveluiden kustannuksia ja sitä, onko kaupunkien välillä eroja siinä, mistä kunkin kaupungin kustannukset koostuvat. THL:n latauspalvelua hyödyntäen ladattiin kaksi eri datasettiä THL:n avoimen datan tietokannasta. Visualisoinnin tarkoituksena oli tehdä esimerkkejä erilaisista kaavioista käyttäen kahta eri THL:n datasettiä ja vertailla kaavioista selviävää dataa. Esimerkeistä selvisi, millaisia kaavioita kannattaa käyttää visualisoimaan dataa. Open data is public information that is available for anyone to use however they want. Open data is on the internet for free, in its entirety and in machine-readable form. Data is open if it has an open license such as Creative Commons BY 4.0 or “by attribution” license.
Data visualization is presenting data in a graphical form. Visualizing data is an excellent way to present information in an easy to understand way to non-technical people. All structured data can be visualized.
The purpose of this thesis was to explain the concepts of open data and data visualization and to find out which visualizations are suitable for presenting different kind of data.
In this thesis the costs of substance abuse and mental health services in the six largest cities in Finland were visualized and also whether there were differences between the cities in terms of what each of their costs consist of. Using the file download service of the Finnish Institute for Health and Welfare (THL), two different datasets were downloaded from THL’s open data database. The purpose of the visualization of THL’s data was to make examples of different charts using two different datasets and to compare the results. All visualizations were made using Microsoft Excel.
Datan visualisointi on tiedon esittämistä graafisessa muodossa. Datan visualisointi on erinomainen tapa esittää tietoa helposti ymmärrettävästi ei-tekniselle yleisölle. Kaikesta rakenteellisesta datasta voi tehdä visualisointeja.
Tämän opinnäytetyön tarkoituksena oli selvittää, mitä on avoin data, millaisia visualisointikeinoja on olemassa ja mitkä visualisoinnit sopivat eri datan esittämiseen.
Työssä visualisoitiin Suomen kuuden suurimman kaupungin päihde- ja mielenterveyspalveluiden kustannuksia ja sitä, onko kaupunkien välillä eroja siinä, mistä kunkin kaupungin kustannukset koostuvat. THL:n latauspalvelua hyödyntäen ladattiin kaksi eri datasettiä THL:n avoimen datan tietokannasta. Visualisoinnin tarkoituksena oli tehdä esimerkkejä erilaisista kaavioista käyttäen kahta eri THL:n datasettiä ja vertailla kaavioista selviävää dataa. Esimerkeistä selvisi, millaisia kaavioita kannattaa käyttää visualisoimaan dataa.
Data visualization is presenting data in a graphical form. Visualizing data is an excellent way to present information in an easy to understand way to non-technical people. All structured data can be visualized.
The purpose of this thesis was to explain the concepts of open data and data visualization and to find out which visualizations are suitable for presenting different kind of data.
In this thesis the costs of substance abuse and mental health services in the six largest cities in Finland were visualized and also whether there were differences between the cities in terms of what each of their costs consist of. Using the file download service of the Finnish Institute for Health and Welfare (THL), two different datasets were downloaded from THL’s open data database. The purpose of the visualization of THL’s data was to make examples of different charts using two different datasets and to compare the results. All visualizations were made using Microsoft Excel.