Impact of synthetic dataset on the accuracy of YOLO object detection neural network
Haavisto, Timo (2024)
Haavisto, Timo
2024
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2024060621856
https://urn.fi/URN:NBN:fi:amk-2024060621856
Tiivistelmä
Opinnäytteessä selvitetään miten automaattisessa prosessissa generoitu synteettinen kuvamateriaali vaikuttaa objektintunnistusneuroverkon tarkkuuteen.
Synteettinen kuvamateriaali tuotetaan generatiivisen neuroverkon tuottamien paloturvamerkkikuvien ja diffuusioneuroverkon generoimien taustakuvien yhdistelmää.
Työ toteutettiin selvittämään Palosuojelurahaston rahoittaman Virpa2-hankkeen keräämän kuvamateriaalin avulla vuonna 2020 toteutetun YOLOv3 -objektintunnistusneuroverkon jatkokehitysmahdollisuuksia synteettistä lisämateriaalia ja algoritmin uusimpia versioita hyödyntäen.
Synteettisen materiaalin tuottaminen alkuperäismateriaalin perusteella kehitetään automaattiseksi prosessiksi. Synteettisen materiaalin vaikutuksen lisäksi uusi objektintunnistusneuroverkko koulutetaan olemassaolevalla materiaalilla tarkkuuden ja nopeuden parantamiseksi.
Tuloksena syntyi täysautomaattinen synteettistä materiaalia tuottava prosessiketju, synteettista materiaalia generoiva neuroverkkomalli, sekä huomattavasti alkuperäistä objektintunnistusta tehokkaampi YOLOv8 -pohjainen neuroverkkomalli projektin jatkokehityskäyttöön. The thesis explains how synthetic image material generated through automatic process affects the accuracy of the object recognition neural network it is being trained with.
The synthetic data is a combination of fire safety sign images produced by a generative adversarial network, injected into background images generated by a latent diffusion neural network.
The commission was carried out to find out the further development possibilities of the YOLOv3 object recognition neural network implemented in 2020 by using the existing footage collected during Virpa2 project, funded by the Fire Protection Fund, by training it with additional synthetic material and the latest versions of the YOLO object detector.
The result was a fully automatic process pipeline producing synthetic material by using unaltered original material, generative adversarial network model trained to generate fire safety signs, and a YOLOv8-based neural network model that is significantly more efficient, improving the fire safety sign object recognition performance of the original project.
Synteettinen kuvamateriaali tuotetaan generatiivisen neuroverkon tuottamien paloturvamerkkikuvien ja diffuusioneuroverkon generoimien taustakuvien yhdistelmää.
Työ toteutettiin selvittämään Palosuojelurahaston rahoittaman Virpa2-hankkeen keräämän kuvamateriaalin avulla vuonna 2020 toteutetun YOLOv3 -objektintunnistusneuroverkon jatkokehitysmahdollisuuksia synteettistä lisämateriaalia ja algoritmin uusimpia versioita hyödyntäen.
Synteettisen materiaalin tuottaminen alkuperäismateriaalin perusteella kehitetään automaattiseksi prosessiksi. Synteettisen materiaalin vaikutuksen lisäksi uusi objektintunnistusneuroverkko koulutetaan olemassaolevalla materiaalilla tarkkuuden ja nopeuden parantamiseksi.
Tuloksena syntyi täysautomaattinen synteettistä materiaalia tuottava prosessiketju, synteettista materiaalia generoiva neuroverkkomalli, sekä huomattavasti alkuperäistä objektintunnistusta tehokkaampi YOLOv8 -pohjainen neuroverkkomalli projektin jatkokehityskäyttöön.
The synthetic data is a combination of fire safety sign images produced by a generative adversarial network, injected into background images generated by a latent diffusion neural network.
The commission was carried out to find out the further development possibilities of the YOLOv3 object recognition neural network implemented in 2020 by using the existing footage collected during Virpa2 project, funded by the Fire Protection Fund, by training it with additional synthetic material and the latest versions of the YOLO object detector.
The result was a fully automatic process pipeline producing synthetic material by using unaltered original material, generative adversarial network model trained to generate fire safety signs, and a YOLOv8-based neural network model that is significantly more efficient, improving the fire safety sign object recognition performance of the original project.