Data-analytiikka ilmanlaatudatan käsittelyssä
Paukkeri, Kaisu (2025)
Paukkeri, Kaisu
2025
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2025112629958
https://urn.fi/URN:NBN:fi:amk-2025112629958
Tiivistelmä
Tutkimuksen tavoitteena oli rakentaa kokonaisvaltainen analytiikkaratkaisu avoimen datan keruusta aina visualisointiin ja automatisointiin asti. Opinnäytetyön tarkoituksena oli selvittää kaikki vaiheet, jotka suoritetaan ennen kuin visualisointia voidaan rakentaa. Datan käsittely, tallennus ja analysointi ovat iso osa analytiikkaprosessia. Visualisoinnin avulla dataa ymmärretään, osataan tulkita ja muistetaan paremmin. Visualisointitapaa valitessa tulee aina ottaa huomioon loppukäyttäjä ja valita visualisoinnin tapa juuri hänen tarpeisiinsa sopivaksi. Aina ei siis ole tarpeen valita hienointa ja trendikkäintä työkalua.
Opinnäytetyön teoreettinen osuus käsittelee datan rakennetta, avoimia datalähteitä sekä visualisointia ja siihen liittyviä haasteita. Teoriassa tarkastellaan myös tässä työssä käytettyjä teknologiota ja työvälineitä. Käytännön osuudessa ratkaisu toteutettiin Python-pohjaisella datankäsittelyllä, jonka avulla haettiin ja esikäsiteltiin avointa dataa ennen visualisointia Power BI:llä ja Streamlitilla. GitHub-alustaa hyödynnettiin versionhallintaan, dokumentointiin ja työnkulkujen automatisointiin GitHub Actions -työkalun avulla. Opinnäytetyö on toiminnallinen, ja sen tuloksena rakennettiin toimiva visualisointi ilmanlaatudatasta. Projekti toteutettiin vaiheittain Scrumin periaatteiden mukaisesti ja jokainen koodimuutos dokumentoitiin GitHub-arkistoon asianmukaisesti nimettyinä versioina.
Tulosten perusteella rakennettu ratkaisu osoitti, että avoimen datan hyödyntäminen ja automatisoitu päivitysprosessi voidaan toteuttaa tehokkaasti sekä Power BI - että Streamlit-visualisoinneilla. Johtopäätöksinä todetaan, että molemmilla työkaluilla on omat käyttäjänsä. Power BI on hyvä määrämuotoisiin ja visuaalisilta ilmeiltään yhtenäisiin raportteihin. Nämä raportit rakennetaan ilman koodia vetämällä ja pudottamalla valikoista visualisointiin kuvaaja sekä tietoaineistot. Power BI integroituu hyvin Microsoftin tuotteisiin, ja mobiilinäkymät toimivat hyvin Power BI:n omassa mobiiliversiossa. Streamlit on vuorovaikutteinen ja nopea verkkosovelluskehys, jossa visualisoinnit rakentuvat puhtaasti Python-ohjelmointikielellä. Streamlit on ilmainen ja toimii kaikilla alustoilla. Raportoinnit julkaistaan nettisivuilla, jotka voidaan tehdä responsiivisiksi erikokoiset päätelaitteet huomioon ottaen. Tulokset osoittavat, että automatisoitu avoimen datan käsittely parantaa tiedon saavutettavuutta ja hyödyntämistä päätöksenteossa. Visualisoinnin ratkaisut edistävät julkisen datan läpinäkyvyyttä ja sen tehokkaampaa hyödyntämistä.
Opinnäytetyön teoreettinen osuus käsittelee datan rakennetta, avoimia datalähteitä sekä visualisointia ja siihen liittyviä haasteita. Teoriassa tarkastellaan myös tässä työssä käytettyjä teknologiota ja työvälineitä. Käytännön osuudessa ratkaisu toteutettiin Python-pohjaisella datankäsittelyllä, jonka avulla haettiin ja esikäsiteltiin avointa dataa ennen visualisointia Power BI:llä ja Streamlitilla. GitHub-alustaa hyödynnettiin versionhallintaan, dokumentointiin ja työnkulkujen automatisointiin GitHub Actions -työkalun avulla. Opinnäytetyö on toiminnallinen, ja sen tuloksena rakennettiin toimiva visualisointi ilmanlaatudatasta. Projekti toteutettiin vaiheittain Scrumin periaatteiden mukaisesti ja jokainen koodimuutos dokumentoitiin GitHub-arkistoon asianmukaisesti nimettyinä versioina.
Tulosten perusteella rakennettu ratkaisu osoitti, että avoimen datan hyödyntäminen ja automatisoitu päivitysprosessi voidaan toteuttaa tehokkaasti sekä Power BI - että Streamlit-visualisoinneilla. Johtopäätöksinä todetaan, että molemmilla työkaluilla on omat käyttäjänsä. Power BI on hyvä määrämuotoisiin ja visuaalisilta ilmeiltään yhtenäisiin raportteihin. Nämä raportit rakennetaan ilman koodia vetämällä ja pudottamalla valikoista visualisointiin kuvaaja sekä tietoaineistot. Power BI integroituu hyvin Microsoftin tuotteisiin, ja mobiilinäkymät toimivat hyvin Power BI:n omassa mobiiliversiossa. Streamlit on vuorovaikutteinen ja nopea verkkosovelluskehys, jossa visualisoinnit rakentuvat puhtaasti Python-ohjelmointikielellä. Streamlit on ilmainen ja toimii kaikilla alustoilla. Raportoinnit julkaistaan nettisivuilla, jotka voidaan tehdä responsiivisiksi erikokoiset päätelaitteet huomioon ottaen. Tulokset osoittavat, että automatisoitu avoimen datan käsittely parantaa tiedon saavutettavuutta ja hyödyntämistä päätöksenteossa. Visualisoinnin ratkaisut edistävät julkisen datan läpinäkyvyyttä ja sen tehokkaampaa hyödyntämistä.
