Koneoppiminen ja sen menetelmien hyödyntäminen asiakaspalveluchatin viestien luokittelussa
Nevalainen, Sari (2026)
Nevalainen, Sari
2026
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-202601131269
https://urn.fi/URN:NBN:fi:amk-202601131269
Tiivistelmä
Tämän opinnäytetyön tarkoituksena oli selvittää, miten valitut ohjatun oppimisen koneoppimismenetelmät soveltuvat asiakaspalveluchatin viestien luokittelutehtävässä. Tavoitteena oli kouluttaa ja testata luokittelumalleja sen arvioimiseksi, kuinka ne kykenevät jakamaan asiakaspalveluchatin viestit ennalta määriteltyihin kategorioihin.
Opinnäytetyön teoriaosuudessa käsiteltiin koneoppimista, erityisesti ohjattua oppimista ja sen menetelmiä, kuten päätöspuu, Naive Bayes ja tukivektorikone. Lisäksi tarkasteltiin luonnollisen kielen käsittelyn (NLP) hyödyntämistä koneoppimisessa sekä koneoppimisprosessin keskeisiä vaiheita tekstiluokittelutehtävässä.
Koneoppimismallien koulutuksessa käytettiin kolmea eri algoritmia: päätöspuu, Naive Bayes ja tukivektorikone. Asiakaspalveluchatin viestit luokiteltiin neljään luokkaan. Koneoppimismallien koulutus toteutettiin Python-ohjelmointikielellä hyödyntäen Pandas-kirjastoa datan käsittelyyn, Scikit-learn-kirjastoa koneoppimismallien rakentamiseen ja arviointiin sekä Matplotlib-kirjastoa tulosten visualisointiin. Suorituskyvyn arvioinnissa käytettiin mittareita F1-score, tarkkuus, osumatarkkuus ja herkkyys.
Tulokset osoittivat, että eri mallien suhteen on eroja muun muassa siinä, miten luokkien epätasapaino voi vaikuttaa kykyyn suoriutua luokittelutehtävästä.
Opinnäytetyön teoriaosuudessa käsiteltiin koneoppimista, erityisesti ohjattua oppimista ja sen menetelmiä, kuten päätöspuu, Naive Bayes ja tukivektorikone. Lisäksi tarkasteltiin luonnollisen kielen käsittelyn (NLP) hyödyntämistä koneoppimisessa sekä koneoppimisprosessin keskeisiä vaiheita tekstiluokittelutehtävässä.
Koneoppimismallien koulutuksessa käytettiin kolmea eri algoritmia: päätöspuu, Naive Bayes ja tukivektorikone. Asiakaspalveluchatin viestit luokiteltiin neljään luokkaan. Koneoppimismallien koulutus toteutettiin Python-ohjelmointikielellä hyödyntäen Pandas-kirjastoa datan käsittelyyn, Scikit-learn-kirjastoa koneoppimismallien rakentamiseen ja arviointiin sekä Matplotlib-kirjastoa tulosten visualisointiin. Suorituskyvyn arvioinnissa käytettiin mittareita F1-score, tarkkuus, osumatarkkuus ja herkkyys.
Tulokset osoittivat, että eri mallien suhteen on eroja muun muassa siinä, miten luokkien epätasapaino voi vaikuttaa kykyyn suoriutua luokittelutehtävästä.