Luokittelumallin päätösrajojen optimointi moniluokkaisessa tapauksessa
Sipari, Jesse (2024)
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2024121736606
https://urn.fi/URN:NBN:fi:amk-2024121736606
Tiivistelmä
Tutkimuksessa tarkasteltiin päätösrajan optimointia viidelle binääriluokittelumallille, joista jokainen luokitteli eri objektiluokkaa (A, B, C, D ja E). Tutkimuksen tavoitteena oli selvittää, voidaanko päätösrajaa P=0,5 vaihtamalla parantaa mallien suorituskykyä ja mitkä vaihtoehtoiset päätösrajat tuottaisivat parempia tilastollisesti merkitseviä tuloksia.
Aineiston analysointi suoritettiin Python-ohjelmoinnin avulla laskemalla luokittelumalleil-le niiden hyvyyden mittaamiseen tarkoitetut tunnusluvut: Accuracy, Balanced Accura-cy, F1 Score ja MCC. Tutkimuksessa huomioitiin tunnuslukujen keskiarvot ja 95%: n luottamusvälit.
Balanced Accuracy -tunnusluvulla luokissa A, B, C ja D löydettiin vaihtoehtoisia pää-tösrajoja, joilla oli parempi suorituskyky kuin P=0,5. Luokassa E päätösraja P=0,5 säi-lyi optimaalisena kaikilla tarkastelluilla tunnusluvuilla.
Aineiston analysointi suoritettiin Python-ohjelmoinnin avulla laskemalla luokittelumalleil-le niiden hyvyyden mittaamiseen tarkoitetut tunnusluvut: Accuracy, Balanced Accura-cy, F1 Score ja MCC. Tutkimuksessa huomioitiin tunnuslukujen keskiarvot ja 95%: n luottamusvälit.
Balanced Accuracy -tunnusluvulla luokissa A, B, C ja D löydettiin vaihtoehtoisia pää-tösrajoja, joilla oli parempi suorituskyky kuin P=0,5. Luokassa E päätösraja P=0,5 säi-lyi optimaalisena kaikilla tarkastelluilla tunnusluvuilla.