Nimikehallinnan laadunvarmistuksen tehostaminen
Ruotsalainen, Ekaterina (2024)
Ruotsalainen, Ekaterina
2024
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-202404126334
https://urn.fi/URN:NBN:fi:amk-202404126334
Tiivistelmä
Viime vuosikymmenien aikana tietojen digitalisaation myötä yritysten nimikedata on kasvanut räjähdysmäisesti, ja siitä on tullut vaikeasti hallittava. Huonolaatuinen nimikedata voi olla este yrityksen sujuvalle liiketoiminnalle. Yleisimmät nimikehallinnan haasteet ovat muun muassa virheellinen tai puuttuva data, nimikeduplikaatit sekä vanhettuneet nimikkeet. Opinnäytetyössä käsiteltiin nimikedatalaadun hallinta master datan näkökulmasta sekä pohdittiin yritysten nimikedatan laatuun liittyvistä ongelmista ja keinoista, joilla nimikedata voitaisiin huoltaa.
Työn käytännön osuudessa etsittiin ratkaisut nimikeduplikaattien sekä virheellisten nimikeattribuuttien löytämiseen nimikedatasta. Nimikeduplikaattien hakua suoritettiin sekä perus Excel-toiminnallisuuksia hyödyntäen että koneoppimismallin avulla Python koodausta käyttäen. Nimikeattribuuttien tarkistukseen oli kehitetty oma työkalu, jossa tarkistustoiminnot suoritettiin VBA-makrolla käynnistettävän Python skriptin avulla.
Työn käytännön osuudessa etsittiin ratkaisut nimikeduplikaattien sekä virheellisten nimikeattribuuttien löytämiseen nimikedatasta. Nimikeduplikaattien hakua suoritettiin sekä perus Excel-toiminnallisuuksia hyödyntäen että koneoppimismallin avulla Python koodausta käyttäen. Nimikeattribuuttien tarkistukseen oli kehitetty oma työkalu, jossa tarkistustoiminnot suoritettiin VBA-makrolla käynnistettävän Python skriptin avulla.