Hyppää sisältöön
    • Suomeksi
    • På svenska
    • In English
  • Suomi
  • Svenska
  • English
  • Kirjaudu
Hakuohjeet
JavaScript is disabled for your browser. Some features of this site may not work without it.
Näytä viite 
  •   Ammattikorkeakoulut
  • Tampereen ammattikorkeakoulu
  • Opinnäytetyöt (Avoin kokoelma)
  • Näytä viite
  •   Ammattikorkeakoulut
  • Tampereen ammattikorkeakoulu
  • Opinnäytetyöt (Avoin kokoelma)
  • Näytä viite

Datan laatu koneoppimisessa

Hulkkonen, Päivi; Raunnos, Eeva (2021)

Avaa tiedosto
Hulkkonen_Paivi_Raunnos_Eeva.pdf (4.437Mt)
Lataukset: 


Hulkkonen, Päivi
Raunnos, Eeva
2021
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2021061415912
Tiivistelmä
Datan määrä organisaatioissa kasvaa kiihtyvällä tahdilla. Perinteisen raportoinnin ja data-analytiikan rinnalla halutaan hyödyntää tekoälyä ja koneoppimista liiketoiminnan kehittämisessä sekä uusissa liiketoimintamahdollisuuksissa. Tämän mahdollistamiseksi datan laadullisiin ominaisuuksiin tulee kiinnittää entistä enemmän huomiota.

Tässä opinnäytetyössä tutkittiin toimeksiantajaorganisaation tietokannan datan laatua ja arvioitiin sen valmiutta koneoppimisen hyödyntämiseen. Tutkimus toteutettiin Kiinteistönvälitysalan Keskusliitto Ry:n KVKL Hintaseurantapalvelulle case-tutkimuksena.

Tutkimuksen teoriaosuudessa käsiteltiin datan laadun rakentumista, laadun ulottuvuuksia ja niiden mittaamista kokonaisuutena. Lisäksi käsiteltiin tekoälyn ja koneoppimisen perusteita, erityisesti koneoppimisen ennustemallien näkökulmasta. Tutkimusosuudessa keskityttiin analysoimaan toimeksiantajan datan laatua objektiivisten mittareiden kautta. Tämän lisäksi tutkimuksessa testattiin kahta erityyppistä koneoppimismallia. Malleja koulutettiin erilaisin tavoin esikäsitellyillä data-aineistoilla. Näin osoitettiin datan laadun merkitys koneoppimisen ennustemalleille.

Tutkimuksen tulokset osoittivat datan muuttuneen merkittävästi vuosien varrella. Datan sisällön ja laadun havaittiin kehittyneen hyvään suuntaan. Koneoppimiskokeilussa ennustemallit ennustivat jopa 90 %:n tarkkuudella asunnon hinnan oikein datan laadun puhdistustoimenpiteiden jälkeen. Vaikka tulos oli varsin hyvä, ennustetarkkuutta saataisiin todennäköisesti parannettua keskittymällä datan oikeellisuuden ja oikeamuotoisuuden parantamiseen. Tulosten pohjalta toimeksiantajalle annettiin kehitysehdotuksia datan laadun kehittämiseksi. Tämän opinnäytetyön ulkopuolelle rajattiin tarkempi koneoppimismallien valintaan ja opti- mointiin liittyvä läpikäynti.
 
Kokoelmat
  • Opinnäytetyöt (Avoin kokoelma)
Ammattikorkeakoulujen opinnäytetyöt ja julkaisut
Yhteydenotto | Tietoa käyttöoikeuksista | Tietosuojailmoitus | Saavutettavuusseloste
 

Selaa kokoelmaa

NimekkeetTekijätJulkaisuajatKoulutusalatAsiasanatUusimmatKokoelmat

Henkilökunnalle

Ammattikorkeakoulujen opinnäytetyöt ja julkaisut
Yhteydenotto | Tietoa käyttöoikeuksista | Tietosuojailmoitus | Saavutettavuusseloste