Tiedonlouhintaprosessien soveltuvuus tietoliikenne-elementtien vikatiedostojen analysoimiseen
Sjöblom, Johanna (2016)
Sjöblom, Johanna
Laurea-ammattikorkeakoulu
2016
All rights reserved
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2016120519181
https://urn.fi/URN:NBN:fi:amk-2016120519181
Tiivistelmä
Tässä opinnäytetyössä tutkitaan tiedonlouhintamenetelmien soveltuvuutta laajojen vikatiedostojen analysointiin ja erityisesti työssä on keskitytty elementteihin, joista ei löydy testeissä vikaa. Opinnäytetyö on osa projektia, jossa on tutkittu syitä tietoliikenne-elementtien vikaantumiseen. Näistä yksiköistä aiheutuu turhia huolto- ja kuljetuskustannuksia. Työn tutkimuskysymys on ”miten tiedonlouhintaprosesseja sovelletaan tietoliikenne-elementtien vikatiedostojen analysoimiseen?”
Tiedonlouhinta tarkoittaa suurten tietojoukkojen kuten tietokantojen, dokumenttien tai mittaustulosten analyysia sekä mallien muodostamista. Työssä käsitellään tiedonlouhintaan liittyviä prosesseja ja keskitytään datan esikäsittelyvaiheisiin. Knowledge Discovery in Databases, KDD viitataan koko prosessiin, jossa etsitään hyödyllistä tietoa datasta ja tiedonlouhinta on oma prosessi KDD-prosessissa.
KDD-prosessi voidaan jakaa viiteen päävaiheeseen, jotka ovat tietämyksen vaatimukset, datan valinta, tiedonlouhinta, tulosten analysointi ja tietämyksen sisällyttäminen tietämyskantaan. Tiedonlouhinta voidaan erikseen jakaa myös viiteen osaan, jotka ovat datan pelkistäminen, menetelmän valinta, datan esikäsittely, datan valmistelu ja metodien käyttö.
Esikäsittelyvaiheen tavoite on mahdollistaa analyysimenetelmät, joilla erotetaan oikeat ja asiaankuuluvat tiedot datasta. Työssä käytetään tiedonlouhinnan esikäsittelytekniikoita. Reaalimaailman data vaatii yleensä puhdistamista, koska siinä on häiriöitä ja epätarkkuuksia.
Tutkimuksen aluksi selvitetään ongelman yleisyyttä muussa teollisuudessa ja määritellään keskeisistä käsitteistä. Tavoitteena oli tutkia teollisuudessa käytettyjä tiedonlouhintaprosesseja ja niissä saatuja testaustuloksia. Tietoliikenne-elementtien vika-analyysit ja tietoliikenneympäristö oli tuttua aikaisemmasta projektista. Tutkimuksen viitekehyksenä tutkittiin Hevnerin (2007) tietojärjestelmätutkimuksen kolmea sykliä. Suunnittelututkimus valittiin tutkimusmetodologiaksi, koska se soveltuu ongelman ratkaisemiseen ja sen arvioimiseen.
Tutkimuksen päätavoitteena oli tietämyksen lisääminen kentällä vikaantuneista tietoliikenne-elementeistä, joista ei löydetä vikaa huollon testeissä. Tiedonlouhintaprosessit sopivat huollosta saatujen vikatiedostojen analysointiin, koska niiden avulla datasta pystytään selvittämään mitä tietoja on saatavilla ja myös datan puutteet tulevat selville. Tietojen esikäsittelytekniikoilla voidaan parantaa datan laatua, mikä osaltaan parantaa tarkkuutta ja tehokkuutta myöhemmissä louhintaprosesseissa.
Tiedonlouhinta tarkoittaa suurten tietojoukkojen kuten tietokantojen, dokumenttien tai mittaustulosten analyysia sekä mallien muodostamista. Työssä käsitellään tiedonlouhintaan liittyviä prosesseja ja keskitytään datan esikäsittelyvaiheisiin. Knowledge Discovery in Databases, KDD viitataan koko prosessiin, jossa etsitään hyödyllistä tietoa datasta ja tiedonlouhinta on oma prosessi KDD-prosessissa.
KDD-prosessi voidaan jakaa viiteen päävaiheeseen, jotka ovat tietämyksen vaatimukset, datan valinta, tiedonlouhinta, tulosten analysointi ja tietämyksen sisällyttäminen tietämyskantaan. Tiedonlouhinta voidaan erikseen jakaa myös viiteen osaan, jotka ovat datan pelkistäminen, menetelmän valinta, datan esikäsittely, datan valmistelu ja metodien käyttö.
Esikäsittelyvaiheen tavoite on mahdollistaa analyysimenetelmät, joilla erotetaan oikeat ja asiaankuuluvat tiedot datasta. Työssä käytetään tiedonlouhinnan esikäsittelytekniikoita. Reaalimaailman data vaatii yleensä puhdistamista, koska siinä on häiriöitä ja epätarkkuuksia.
Tutkimuksen aluksi selvitetään ongelman yleisyyttä muussa teollisuudessa ja määritellään keskeisistä käsitteistä. Tavoitteena oli tutkia teollisuudessa käytettyjä tiedonlouhintaprosesseja ja niissä saatuja testaustuloksia. Tietoliikenne-elementtien vika-analyysit ja tietoliikenneympäristö oli tuttua aikaisemmasta projektista. Tutkimuksen viitekehyksenä tutkittiin Hevnerin (2007) tietojärjestelmätutkimuksen kolmea sykliä. Suunnittelututkimus valittiin tutkimusmetodologiaksi, koska se soveltuu ongelman ratkaisemiseen ja sen arvioimiseen.
Tutkimuksen päätavoitteena oli tietämyksen lisääminen kentällä vikaantuneista tietoliikenne-elementeistä, joista ei löydetä vikaa huollon testeissä. Tiedonlouhintaprosessit sopivat huollosta saatujen vikatiedostojen analysointiin, koska niiden avulla datasta pystytään selvittämään mitä tietoja on saatavilla ja myös datan puutteet tulevat selville. Tietojen esikäsittelytekniikoilla voidaan parantaa datan laatua, mikä osaltaan parantaa tarkkuutta ja tehokkuutta myöhemmissä louhintaprosesseissa.