Kasvojen osien tunnistus
Lumi, Kwon (2020)
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-202004306600
https://urn.fi/URN:NBN:fi:amk-202004306600
Tiivistelmä
Opinnäytetyön tavoitteena oli toteuttaa sovellus kasvojen tunnistukseen silmien, nenän ja suun perusteella. Tutkimuksessa koulutettiin tekoälymallille, miten paikallistaa silmät ja nenä, ja tehtiin sovellus, joka palauttaa silmät, nenän ja suun kuvasta. Tätä sovellusta voidaan hyödyntää tulevissa tutkimuksissa.
Kasvojen osien sijainnit tunnistettiin Custom Vision -palvelulla. Custom Vision -kirjaston avulla kuvasta leikattiin silmät, nenä ja suu ja leikatut kuvat palautettiin tiedon kanssa missä ne sijaitsivat alkuperäisessä kuvassa. Sovellus on API-rajapinta, joka palauttaa dataa HTTP-pyynnöstä. Sovellus tehtiin Azure Functionilla ja kuvat tallennettiin Azure Blob Storageen.
Kasvojen osat tunnistettiin hyvin, myös osa peitettynä, sivuprofiilissa tai silmälasien kanssa. Rajapinta toimi hyvin lukuun ottamatta joskus ensimmäisellä kyselyllä palautuvaa ”palvelu ei ole saatavilla”-virheviestiä.
Esineiden tunnistusteknologia on jo kehitetty, ja sitä ei ole vaikea käyttää. Mutta kasvojen osien tunnistus kuvasta tunnistettujen yksittäisten piirteiden perusteella ei ole valmiina huipputeknologiassakaan. Jatkotutkimus vaatii näistä teknologioista syvällistä tietoa, jota ei voitu käsitellä kattavasti tässä tutkimuksessa. The object of the thesis was to make an application that would use machine learning to recognize people by their eyes, nose and mouth. The application would find eyes, nose and mouth from a portrait using the machine learning framework. As the next step, the application would cut the parts of the face and return the parts with their positions, as JSON type.
The Custom Vision Machine learning framework was used for recognition of eyes, nose and mouth. It returned the position and the size of the parts of the face from the portrait. Azure Function cropped the face parts using the data from Custom Vision. It saved them to Azure Storage and returned the address of the pictures.
The application worked as intended, except that the result API throws Service Unavailable error. It worked well even if some part of the face was covered.
The object detection technology is already sophisticated, and the machine learning framework for the detection was easy to use. The next step of the research is recognizing an individual face from the data, which needs knowledge of state-of-the-art technology.
Kasvojen osien sijainnit tunnistettiin Custom Vision -palvelulla. Custom Vision -kirjaston avulla kuvasta leikattiin silmät, nenä ja suu ja leikatut kuvat palautettiin tiedon kanssa missä ne sijaitsivat alkuperäisessä kuvassa. Sovellus on API-rajapinta, joka palauttaa dataa HTTP-pyynnöstä. Sovellus tehtiin Azure Functionilla ja kuvat tallennettiin Azure Blob Storageen.
Kasvojen osat tunnistettiin hyvin, myös osa peitettynä, sivuprofiilissa tai silmälasien kanssa. Rajapinta toimi hyvin lukuun ottamatta joskus ensimmäisellä kyselyllä palautuvaa ”palvelu ei ole saatavilla”-virheviestiä.
Esineiden tunnistusteknologia on jo kehitetty, ja sitä ei ole vaikea käyttää. Mutta kasvojen osien tunnistus kuvasta tunnistettujen yksittäisten piirteiden perusteella ei ole valmiina huipputeknologiassakaan. Jatkotutkimus vaatii näistä teknologioista syvällistä tietoa, jota ei voitu käsitellä kattavasti tässä tutkimuksessa.
The Custom Vision Machine learning framework was used for recognition of eyes, nose and mouth. It returned the position and the size of the parts of the face from the portrait. Azure Function cropped the face parts using the data from Custom Vision. It saved them to Azure Storage and returned the address of the pictures.
The application worked as intended, except that the result API throws Service Unavailable error. It worked well even if some part of the face was covered.
The object detection technology is already sophisticated, and the machine learning framework for the detection was easy to use. The next step of the research is recognizing an individual face from the data, which needs knowledge of state-of-the-art technology.