Text-independent offline writer identification using convolutional neural networks
Kiviniitty, Jesse (2019)
Kiviniitty, Jesse
2019
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2019061316807
https://urn.fi/URN:NBN:fi:amk-2019061316807
Tiivistelmä
As technology and hardware capabilities improve, the use of machine learning increases in every industry from stock market analysis to image processing. Also, the amount of data is exponentially increasing and forces to develop machine learning solutions to create value from that data. Offline writer identification is a machine learning solution to recognize a writer based on scanned handwritten text.
The main goal of this thesis was to research and implement a convolutional neural network model for identifying writers based on the characteristics of their writing styles. The model is built using the neural network library Keras and TensorFlow as backend.
During the project, many different writer identification techniques were researched, and a working offline writer identification model was developed. The Google Cloud computing platform was used for
the project model training.
The project resulted in a model which can reliably identify a writer based on handwritten sentences. The possible next steps in the project is to implement an automated method of training and identifying additional writers. Teknologian ja laitteistojen suorituskyvyn noustessa koneoppimisen hyödyntäminen lisääntyy kaikilla aloilla pörssikursseista kuvien analysoimiseen. Myös datan määrä on jatkuvasti räjähdysmäisessä kasvussa, ja datan jalostaminen hyödylliseksi pakottaa kehittämään arvoa luovia koneoppimisen ratkaisuja. Avustamaton kirjoittajan tunnistaminen on koneoppimisen ratkaisu kirjoittajan tunnistamiseen skannatun käsialanäytteen avulla.
Opinnäytetyön tavoitteena oli tutkia ja toteuttaa konvoluutioneuroverkkomalli, joka tunnistaa kirjoitustyylin piirteiden perusteella kirjoittajan. Malli on rakennettu käyttäen Keras-neuroverkkojen koodikirjastoa ja taustajärjestelmänä TensorFlowkoneoppimisohjelmistoa.
Opinnäytetyön aikana tutkittiin useaa erilaista kirjoittajan tunnistamismenetelmää ja kehitettiin toimiva avustamaton kirjoittajan tunnistamismalli. Projektin mallin opettamiseen käytettiin IAM-tietokantaa ja paikallisen laitteiston sijaan Google Cloud -
ohjelmistoalustaa.
Opinnäytetyön tuloksena valmistui malli, joka pystyy luotettavasti tunnistamaan kirjoitustyylin piirteiden perusteella kirjoittajan. Mahdollinen seuraava askel projektissa on laajentaa olemassa olevaa mallia ja toteuttaa automaattinen tapa opettaa ja tunnistaa uusia kirjoittajia.
The main goal of this thesis was to research and implement a convolutional neural network model for identifying writers based on the characteristics of their writing styles. The model is built using the neural network library Keras and TensorFlow as backend.
During the project, many different writer identification techniques were researched, and a working offline writer identification model was developed. The Google Cloud computing platform was used for
the project model training.
The project resulted in a model which can reliably identify a writer based on handwritten sentences. The possible next steps in the project is to implement an automated method of training and identifying additional writers.
Opinnäytetyön tavoitteena oli tutkia ja toteuttaa konvoluutioneuroverkkomalli, joka tunnistaa kirjoitustyylin piirteiden perusteella kirjoittajan. Malli on rakennettu käyttäen Keras-neuroverkkojen koodikirjastoa ja taustajärjestelmänä TensorFlowkoneoppimisohjelmistoa.
Opinnäytetyön aikana tutkittiin useaa erilaista kirjoittajan tunnistamismenetelmää ja kehitettiin toimiva avustamaton kirjoittajan tunnistamismalli. Projektin mallin opettamiseen käytettiin IAM-tietokantaa ja paikallisen laitteiston sijaan Google Cloud -
ohjelmistoalustaa.
Opinnäytetyön tuloksena valmistui malli, joka pystyy luotettavasti tunnistamaan kirjoitustyylin piirteiden perusteella kirjoittajan. Mahdollinen seuraava askel projektissa on laajentaa olemassa olevaa mallia ja toteuttaa automaattinen tapa opettaa ja tunnistaa uusia kirjoittajia.