ETL-prosessin suunnittelu
Kemppainen, Janne (2015)
Kemppainen, Janne
Haaga-Helia ammattikorkeakoulu
2015
All rights reserved
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2015120218845
https://urn.fi/URN:NBN:fi:amk-2015120218845
Tiivistelmä
Tiedon muokkaamisessa käytetään ETL-prosesseja jotka automatisoidaan ja tieto päivite-tään omien tarpeiden mukaan. Opinnäytetyössä käydään läpi prosessin eri vaiheita.
Opinnäytetyö on kevyt käsikirja, jonka avulla aloittavat prosessin kehittäjät pääsevät alkuun. Prosessin pilkkominen hallittaviin kokonaisuuksiin onnistuu tuntemalla kuinka tietoa hyödyn-netään eri vaiheissa. Tämä prosessin pilkkominen helpottaa virhetilanteissa ja ongelmien korjaamisessa.
Vaiheittainen prosessi on tarpeellinen hajanaisen infrastruktuurin myötä, kaikkia asioita ei kannata tehdä yhdessä työssä.
Prosessin suurena osana on tietojen rikastaminen ja muokkaaminen. Tietoa voidaan muoka-ta tietokannassa tai ETL-työkaluilla. ETL-työkalua valittaessa omien tarpeiden mukaan on asioita jota tulee pohtia. Näissä työkaluissa on eri ominaisuuksia, mahdollisuus on muun muassa valita avoimen lähdekoodin tai suljetun koodin välillä. Tietojen muokkaamiseen tulee työkalun mukaan eri komponentteja joita voidaan hyödyntää.
Valmiin prosessin muokkaaminen on haasteellinen tehtävä kun dokumentointi on olematon ja infrastruktuurin ollessa hajanainen. Uudelleen kehittäminen vaatii koko prosessin vahvaa tuntemista. Samalla on otettava huomioon kehittämisen liittyvät tekniset ja taloudelliset rajoi-tukset. Prosessin työt on hyvä suunnitella käyttämään vahvuuksia infrastruktuurissa. Ylläpi-don tulee kuitenkin olla helppoa ja täytyy onnistua myös muiden toimesta.
Valmiin prosessin muokkaaminen vaati alkuun vanhan prosessin kuvaamisen, ja sovelluksen tietomallin purkamisen tietokannasta. Tulevat muutokset on syytä kehittää jo olemassa ole-viin prosesseihin. Prosessin päivitys muodostuu uusista moduuleista jotka voidaan liittää sellaisenaan olemassa oleviin töihin.
Opinnäytetyö on kevyt käsikirja, jonka avulla aloittavat prosessin kehittäjät pääsevät alkuun. Prosessin pilkkominen hallittaviin kokonaisuuksiin onnistuu tuntemalla kuinka tietoa hyödyn-netään eri vaiheissa. Tämä prosessin pilkkominen helpottaa virhetilanteissa ja ongelmien korjaamisessa.
Vaiheittainen prosessi on tarpeellinen hajanaisen infrastruktuurin myötä, kaikkia asioita ei kannata tehdä yhdessä työssä.
Prosessin suurena osana on tietojen rikastaminen ja muokkaaminen. Tietoa voidaan muoka-ta tietokannassa tai ETL-työkaluilla. ETL-työkalua valittaessa omien tarpeiden mukaan on asioita jota tulee pohtia. Näissä työkaluissa on eri ominaisuuksia, mahdollisuus on muun muassa valita avoimen lähdekoodin tai suljetun koodin välillä. Tietojen muokkaamiseen tulee työkalun mukaan eri komponentteja joita voidaan hyödyntää.
Valmiin prosessin muokkaaminen on haasteellinen tehtävä kun dokumentointi on olematon ja infrastruktuurin ollessa hajanainen. Uudelleen kehittäminen vaatii koko prosessin vahvaa tuntemista. Samalla on otettava huomioon kehittämisen liittyvät tekniset ja taloudelliset rajoi-tukset. Prosessin työt on hyvä suunnitella käyttämään vahvuuksia infrastruktuurissa. Ylläpi-don tulee kuitenkin olla helppoa ja täytyy onnistua myös muiden toimesta.
Valmiin prosessin muokkaaminen vaati alkuun vanhan prosessin kuvaamisen, ja sovelluksen tietomallin purkamisen tietokannasta. Tulevat muutokset on syytä kehittää jo olemassa ole-viin prosesseihin. Prosessin päivitys muodostuu uusista moduuleista jotka voidaan liittää sellaisenaan olemassa oleviin töihin.