Materiaalikonversiot: Tekstidatan käsittely sovelluksen ulkorajapinnassa
Pirttilahti, Veera (2024)
Pirttilahti, Veera
2024
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2024121335638
https://urn.fi/URN:NBN:fi:amk-2024121335638
Tiivistelmä
Tämän opinnäytetyön tavoitteena oli vertailla tekstidatan muuntamiseen käytettyjen nykyisten ja uusien teknologioiden soveltuvuutta helppokäyttöisyyden, kompleksisuuden ja käytettävyyden näkökulmista. Työssä tutkittiin, kuinka Python-ohjelmointikieli, pandas-kirjasto ja Jupyter Notebook -ympäristö vertautuvat toimeksiantajayrityksen nykyisiin työkaluihin. Teoreettinen viitekehys käsitteli tekstidatan käsittelyn perusperiaatteita ja ohjelmointikielien kehitystä sen tukena.
Tutkimustyön analyysiosuus eteni kolmessa vaiheessa. Ensin suoritettiin nykytilan ja uusien työkalujen analyysi, jossa kartoitettiin molempien työkaluketjujen vahvuudet ja heikkoudet dokumentaation ja prosessikuvausten perusteella. Tämän jälkeen toteutettiin PoC-analyysi, jossa arvioitiin testikonversioista saadut tekniset havainnot ja koodit suhteessa tutkimuksen tavoitteisiin. Lopuksi analyysien pohjalta tehtiin uusien ja nykyisten työkalujen vertailu työn tavoitteiden mukaisista näkökulmista.
Tulokset osoittivat, että uudet työkalut yksinkertaistavat prosesseja ja vähentävät manuaalisten vaiheiden tarvetta. Lisäksi ne parantavat virheiden tunnistamista ja korjaamista. Mahdollisiksi haasteiksi havaittiin vaatimus Python-osaamiselle sekä rajoitukset suurten datamäärien käsittelyssä.
Tutkimustyön analyysiosuus eteni kolmessa vaiheessa. Ensin suoritettiin nykytilan ja uusien työkalujen analyysi, jossa kartoitettiin molempien työkaluketjujen vahvuudet ja heikkoudet dokumentaation ja prosessikuvausten perusteella. Tämän jälkeen toteutettiin PoC-analyysi, jossa arvioitiin testikonversioista saadut tekniset havainnot ja koodit suhteessa tutkimuksen tavoitteisiin. Lopuksi analyysien pohjalta tehtiin uusien ja nykyisten työkalujen vertailu työn tavoitteiden mukaisista näkökulmista.
Tulokset osoittivat, että uudet työkalut yksinkertaistavat prosesseja ja vähentävät manuaalisten vaiheiden tarvetta. Lisäksi ne parantavat virheiden tunnistamista ja korjaamista. Mahdollisiksi haasteiksi havaittiin vaatimus Python-osaamiselle sekä rajoitukset suurten datamäärien käsittelyssä.
