OptoGait-kävelyaineiston analysoiminen koneoppimismallien avulla : luokittelualgoritmien käyttö kävelijän tunnistuksessa
Böök, Tytti (2023)
Böök, Tytti
2023
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-202305088466
https://urn.fi/URN:NBN:fi:amk-202305088466
Tiivistelmä
Opinnäytetyön tavoitteena on saada kuva siitä, mitä erilaisia kävelypiirteitä koneoppimisella voidaan löytää OptoGait-kävelydatasta. Tarkoituksena on etsiä ja muokata sekä testata toimivaksi algoritmi, jolla voidaan opettaa tekoäly tunnistamaan kävelydatasta henkilöitä ja heidän kävelynsä piirteitä yksittäisten askeleiden perusteella. Lähtökohtana on käyttää tutkimuksessa klassisia luokittelualgoritmeja aiheen rajaamiseksi. Lähdekirjallisuuden pohjalta käyttöön valittiin seitsemän luokittelualgoritmia. Luokiteltaviksi ominaisuuksiksi otettiin yksittäisen kävelijän identifioiminen, sekä sukupuolen tunnistaminen otetun askeleen perusteella.
Idea tälle opinnäytetyölle lähti tarpeesta testata koneoppimismallin käytön prosessia OptoGait-kävelydataan. Yleisesti koneoppimista voidaan käyttää datan analysoinnissa sellaisten kaavojen havaitsemiseen, joita muuten olisi vaikea erottaa. Datan keräämiseen käytettävä laitteisto on OptoGait-kävelyanalyysilaite, jota käytetään liikeanalyysin tekemiseen ja potilaan toiminnan arviointiin. OptoGaitin tuottamassa raportissa korostuvat mm. kahden jalan väliset epäsymmetriat ja niistä voidaan havaita kaatumisriskiin vaikuttavia tekijöitä.
Tämä työ kuvaa kuinka OptoGait-laitteella voidaan kerätä kävelydataa ja kuinka dataa voidaan analysoida koneoppimismenetelmien avulla. Tämän tutkimuksen toimeksiantaja on Tampereen ammattikorkeakoulu. Luotua koneoppimismallia sekä tässä työssä esiteltävää prosessikuvausta on tarkoitus jatkossa soveltaa Tampereen yliopistollisen keskussairaalan tutkimukseen, joka käsittelee Parkinson-potilaiden kaatumisriskin havaitsemista kävelydatasta.
Opinnäytetyön aineisto hankittiin rekrytoimalla viisi opiskelijaa Tampereen ammattikorkeakoulun fysioterapiaopiskelijoista ja viisi muuta henkilöä. Yhteensä tutkittavia oli 10. Testin aikana tutkittavat kävelivät OptoGait-laitteen palkkien määrittämän viiden metrin alueen kaksi kertaa päästä päähän, joten testaukseen sisältyi myös kolme kääntymistä. Kääntymiset päätettiin lopulta kuitenkin esikäsitellä pois aineistosta, koska ne sisälsivät paljon tyhjiä arvoja ja näin ollen huononsivat datan tarkkuutta. Jatkotutkimuskysymyksenä on se, onko null-arvojen määrä ainoa syy huonoihin ennusteisiin ja mitkä muut asiat vaikuttavat ennusteen luotettavuuteen.
Tekoälyn opettamisessa käytettiin ohjelmana Anaconda Navigatorin Spyder-ohjelmaa. Ohjelmointikielenä käytettiin Pythonia. Kävelijän tunnistaminen onnistui parhaiten Random Forest -algoritmilla. Tuolloin luokittelun onnistumisprosentiksi tuli 66,6%. Tulokset algoritmeilla vaihtelivat 32% ja 66,6% välillä. Kävelijän sukupuolen määrittäminen onnistui parhaiten Päätöspuulla eli Decision Treellä. Tuolloin luokittelun onnistumisprosentiksi tuli 85,5%. Tulokset kaikilla algoritmeilla vaihtelivat 55% ja 85,5% välillä. Yleistettävyys ei kuitenkaan ole mahdollista pienen otannan vuoksi. Jatkotutkimusaiheena on käyttää modifioituja luokittelualgoritmeja kyseiseen datasettiin samoilla tutkimuskysymyksillä. Luotua koneoppimismallia sekä tässä työssä esiteltävää prosessikuvausta on tarkoitus jatkossa soveltaa tutkimukseen, joka käsittelee Parkinson-potilaiden kaatumisriskin havaitsemista kävelydatasta.
Idea tälle opinnäytetyölle lähti tarpeesta testata koneoppimismallin käytön prosessia OptoGait-kävelydataan. Yleisesti koneoppimista voidaan käyttää datan analysoinnissa sellaisten kaavojen havaitsemiseen, joita muuten olisi vaikea erottaa. Datan keräämiseen käytettävä laitteisto on OptoGait-kävelyanalyysilaite, jota käytetään liikeanalyysin tekemiseen ja potilaan toiminnan arviointiin. OptoGaitin tuottamassa raportissa korostuvat mm. kahden jalan väliset epäsymmetriat ja niistä voidaan havaita kaatumisriskiin vaikuttavia tekijöitä.
Tämä työ kuvaa kuinka OptoGait-laitteella voidaan kerätä kävelydataa ja kuinka dataa voidaan analysoida koneoppimismenetelmien avulla. Tämän tutkimuksen toimeksiantaja on Tampereen ammattikorkeakoulu. Luotua koneoppimismallia sekä tässä työssä esiteltävää prosessikuvausta on tarkoitus jatkossa soveltaa Tampereen yliopistollisen keskussairaalan tutkimukseen, joka käsittelee Parkinson-potilaiden kaatumisriskin havaitsemista kävelydatasta.
Opinnäytetyön aineisto hankittiin rekrytoimalla viisi opiskelijaa Tampereen ammattikorkeakoulun fysioterapiaopiskelijoista ja viisi muuta henkilöä. Yhteensä tutkittavia oli 10. Testin aikana tutkittavat kävelivät OptoGait-laitteen palkkien määrittämän viiden metrin alueen kaksi kertaa päästä päähän, joten testaukseen sisältyi myös kolme kääntymistä. Kääntymiset päätettiin lopulta kuitenkin esikäsitellä pois aineistosta, koska ne sisälsivät paljon tyhjiä arvoja ja näin ollen huononsivat datan tarkkuutta. Jatkotutkimuskysymyksenä on se, onko null-arvojen määrä ainoa syy huonoihin ennusteisiin ja mitkä muut asiat vaikuttavat ennusteen luotettavuuteen.
Tekoälyn opettamisessa käytettiin ohjelmana Anaconda Navigatorin Spyder-ohjelmaa. Ohjelmointikielenä käytettiin Pythonia. Kävelijän tunnistaminen onnistui parhaiten Random Forest -algoritmilla. Tuolloin luokittelun onnistumisprosentiksi tuli 66,6%. Tulokset algoritmeilla vaihtelivat 32% ja 66,6% välillä. Kävelijän sukupuolen määrittäminen onnistui parhaiten Päätöspuulla eli Decision Treellä. Tuolloin luokittelun onnistumisprosentiksi tuli 85,5%. Tulokset kaikilla algoritmeilla vaihtelivat 55% ja 85,5% välillä. Yleistettävyys ei kuitenkaan ole mahdollista pienen otannan vuoksi. Jatkotutkimusaiheena on käyttää modifioituja luokittelualgoritmeja kyseiseen datasettiin samoilla tutkimuskysymyksillä. Luotua koneoppimismallia sekä tässä työssä esiteltävää prosessikuvausta on tarkoitus jatkossa soveltaa tutkimukseen, joka käsittelee Parkinson-potilaiden kaatumisriskin havaitsemista kävelydatasta.