Syväoppimiseen perustuva objektien tunnistus web-sovelluksessa
Satejeff, Niko (2025)
Satejeff, Niko
2025
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2025121737411
https://urn.fi/URN:NBN:fi:amk-2025121737411
Tiivistelmä
Objektientunnistuksen soveltamista haluttiin tutkia kehittämällä yksinkertainen ja helposti lähestyttävä kokonaisuus, jossa moderni neuroverkostomalli liitettiin osaksi web-sovellusta. Tavoitteena oli selvittää, kuinka vaivattomasti yksivaiheinen objektientunnistusmalli voitaisiin kouluttaa, kuinka tarkaksi malli saataisiin rajallisilla resursseilla sekä missä määrin kuka tahansa pystyisi rakentamaan toimivan objektintunnistus-ratkaisun avoimia työkaluja hyödyntäen.
Mallien koulutus toteutettiin YOLO11-arkkitehtuurilla käyttäen COCO 2017 datasettiä, joka rajattiin 21 luokkaan ja noin 58 000 kuvaan. Työssä verrattiin, kuinka muutaman hyperparametrin muuttaminen vaikutti tarkkuuteen ja suorituskykyyn. Koulutus tehtiin kannettavan tietokoneen RTX 3050 ti näytönohjaimella, mikä asetti rajoituksia mallien koolle ja lisäksi koulutusaikoihin. Tulosten arvioinnissa hyödynnettiin mm. confusion-matriisia, mAP50-arvoja sekä validoinnin tuottamia mittareita.
Malleja hyödynnettiin lopuksi Django-pohjaisessa web-sovelluksessa, joka mahdollisti kuvien ja videoiden tunnistamisen selaimessa. Toteutus osoitti, että yksinkertainen objektientunnistusjärjestelmä voitiin rakentaa avoimilla työkaluilla ilman suurta laskentakapasiteettia, kun datan käsittely ja mallin optimointi suunniteltiin huolella.
Mahdollisia jatkokehitysmahdollisuuksia ovat datasetin tasapainottaminen, itse kasattu ja luokiteltu data-setti. Tämä mahdollistaisi mallille täsmällisemmän opetusmateriaalin. Lisäksi mallin suorituskykyä voitaisiin kehittää hyödyntämällä suurempia YOLO-malleja kuten Yolo11m tai Yolo11l. Toisena kehitys vaihtoehtona olisi mallin optimointi käyttämällä erilaisia formaatteja kuten ONNX tai OpenVINO, jotka voisivat tarjota parannuksia suoritusaikaan etenkin CPU-pohjaisilla järjestelmillä.
Mallien koulutus toteutettiin YOLO11-arkkitehtuurilla käyttäen COCO 2017 datasettiä, joka rajattiin 21 luokkaan ja noin 58 000 kuvaan. Työssä verrattiin, kuinka muutaman hyperparametrin muuttaminen vaikutti tarkkuuteen ja suorituskykyyn. Koulutus tehtiin kannettavan tietokoneen RTX 3050 ti näytönohjaimella, mikä asetti rajoituksia mallien koolle ja lisäksi koulutusaikoihin. Tulosten arvioinnissa hyödynnettiin mm. confusion-matriisia, mAP50-arvoja sekä validoinnin tuottamia mittareita.
Malleja hyödynnettiin lopuksi Django-pohjaisessa web-sovelluksessa, joka mahdollisti kuvien ja videoiden tunnistamisen selaimessa. Toteutus osoitti, että yksinkertainen objektientunnistusjärjestelmä voitiin rakentaa avoimilla työkaluilla ilman suurta laskentakapasiteettia, kun datan käsittely ja mallin optimointi suunniteltiin huolella.
Mahdollisia jatkokehitysmahdollisuuksia ovat datasetin tasapainottaminen, itse kasattu ja luokiteltu data-setti. Tämä mahdollistaisi mallille täsmällisemmän opetusmateriaalin. Lisäksi mallin suorituskykyä voitaisiin kehittää hyödyntämällä suurempia YOLO-malleja kuten Yolo11m tai Yolo11l. Toisena kehitys vaihtoehtona olisi mallin optimointi käyttämällä erilaisia formaatteja kuten ONNX tai OpenVINO, jotka voisivat tarjota parannuksia suoritusaikaan etenkin CPU-pohjaisilla järjestelmillä.
