Ansiktsdetektering på resursbegränsad hårdvara : en prestandajämförelse av open-source modeller på Raspberry Pi 4
Åhl, Erik (2026)
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-202604015514
https://urn.fi/URN:NBN:fi:amk-202604015514
Tiivistelmä
Detta arbete behandlar prestandaanalys av ansiktsdetektering på resursbegränsad hårdvara inom kontexten hemautomation. Utvecklingen inom datorseende har gjort avancerade detekteringsmetoder mer tillgängliga, men deras praktiska användbarhet på billigare och energieffektiv hårdvara är fortfarande begränsad av beräkningskapacitet. Syftet med arbetet är därför att undersöka hur avancerade ansiktsdetekteringsmodeller som kan köras på en Raspberry Pi 4 utan att systemets stabilitet eller funktion påverkas negativt. Fokus ligger på att jämföra modellernas noggrannhet, prestanda och resursförbrukning.
Tre ansiktsdetekteringsmodeller valdes för studien: Haar Cascades, Dlibs HOG-baserade detektor och DeepStack. Begränsningen till dessa modeller gjordes för att representera olika nivåer av beräkningskomplexitet och arkitektur. Testerna genomfördes i två steg. Inledningsvis utvärderades modellerna på stillbilder från WIDER FACE-datasetet för att analysera detektionsnoggrannhet, bearbetningstid samt CPU och RAM användning under kontrollerade förhållanden. Därefter genomfördes realtidsdetektering på en videoström från en USB-webbkamera för att analysera praktisk prestanda, inklusive bildfrekvens och kontinuerlig resursbelastning.
Resultaten visar att Haar Cascades uppnår högst bildfrekvens vid realtidsdetektering, men med lägre detektionsnoggrannhet jämfört med de övriga modellerna. Dlib uppvisar hög noggrannhet men låg bildfrekvens, medan DeepSatack når hög detektionsförmåga men påverkas av ökad latens till följd av dess serverbaserade arkitektur. RAM användningen var relativt stabil mellan modellerna, medan tydligare skillnader observerades i CPU belastning och bearbetningstid. Sammantaget visar studien att valet av ansiktsdetekteringsmodell på resursbegränsad hårdvara innebär tydliga avvägningar mellan noggrannhet, prestanda och praktisk användbarhet.
Tre ansiktsdetekteringsmodeller valdes för studien: Haar Cascades, Dlibs HOG-baserade detektor och DeepStack. Begränsningen till dessa modeller gjordes för att representera olika nivåer av beräkningskomplexitet och arkitektur. Testerna genomfördes i två steg. Inledningsvis utvärderades modellerna på stillbilder från WIDER FACE-datasetet för att analysera detektionsnoggrannhet, bearbetningstid samt CPU och RAM användning under kontrollerade förhållanden. Därefter genomfördes realtidsdetektering på en videoström från en USB-webbkamera för att analysera praktisk prestanda, inklusive bildfrekvens och kontinuerlig resursbelastning.
Resultaten visar att Haar Cascades uppnår högst bildfrekvens vid realtidsdetektering, men med lägre detektionsnoggrannhet jämfört med de övriga modellerna. Dlib uppvisar hög noggrannhet men låg bildfrekvens, medan DeepSatack når hög detektionsförmåga men påverkas av ökad latens till följd av dess serverbaserade arkitektur. RAM användningen var relativt stabil mellan modellerna, medan tydligare skillnader observerades i CPU belastning och bearbetningstid. Sammantaget visar studien att valet av ansiktsdetekteringsmodell på resursbegränsad hårdvara innebär tydliga avvägningar mellan noggrannhet, prestanda och praktisk användbarhet.
