Kaustislaisen viulumusiikin tunnistaminen arkistonauhoitteista koneoppimismenetelmillä : äänipiirteiden vertailu koneoppimismallien avulla
Ylönen, Tuomas (2025)
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2025082724187
https://urn.fi/URN:NBN:fi:amk-2025082724187
Tiivistelmä
Suomen Kansanmusiikki-instituutin suurin kokoelma sisältää äänitteitä Kaustisen kansanmusiikkifestivaaleilta vuodesta 1968 alkaen. Äänitteet on luokiteltu käsin, mutta usein merkinnät ovat vajavaisia. Arkistolla olisi tarvetta "Kaustislainen viulunsoitto" -tunnisteelle, joka viittaa siihen elementtiin, joka lisättiin Unescon aineettoman kulttuuriperinnön edustavaan luetteloon vuonna 2021. Tämän opinnäytetyön analyysien tuottamia tuloksia hyödyntämällä pyrittiin helpottamaan jatkotutkimuksia ja nostamaan arkistonhoidon laatua. Tämä soittotyyli erottuu perinteisessä viulunsoitosta synkopaattisilla ja korostavilla rytmeillä, joissa jousen suuntaa vaihdetaan poikkeavassa tahdissa.
Tässä opinnäytetyössä esitettiin muutamia neuroverkkoluokittelijoita, joiden avulla voidaan tunnistaa, onko kyseinen soittotyyli läsnä äänitteessä. Syötteenä käytettiin joko spektrogrammeja tai äänipiirteitä. Syötteet on muokattu alkuperäisistä Kansanmusiikki-instituutin nauhoitteista koneoppimismalleille sopiviksi.
Parhaan tuloksen eli 97 prosentin tarkkuuden, saavutti eteenpäin syöttävä neuroverkko, joka hyödyntää Melkelpstrikertoimia, Mel-spektrogrammeja sekä kroma- ja tonnetz-piirteitä. The largest collection of the Finnish Folk Music Institute consists of recordings from the Kaustinen Folk Music Festival, dating back to 1968. The recordings have been manually classified, but often the annotations are incomplete. The archive has a need for a "Kaustinen fiddle playing" label, referring to the element that was added to UNESCO’s Representative List of Intangible Cultural Heritage in 2021. By utilizing the results produced by the analyses of this thesis, the aim was to facilitate further research and improve the quality of archive management.
This playing style stands out from traditional fiddle playing with its syncopated and emphasized rhythms, where the direction of the bow changes in an unconventional manner. In this thesis, several neural network classifiers were presented to identify whether this playing style is present in a recording. The input used were adapted from the original recordings of the Folk Music Institute to be suitable for machine learning models.
The best result, achieving an accuracy of 97%, was obtained with a neural network utilizing Mel-frequency cepstral coefficients, Mel spectrograms, as well as chroma and tonnetz features.
Tässä opinnäytetyössä esitettiin muutamia neuroverkkoluokittelijoita, joiden avulla voidaan tunnistaa, onko kyseinen soittotyyli läsnä äänitteessä. Syötteenä käytettiin joko spektrogrammeja tai äänipiirteitä. Syötteet on muokattu alkuperäisistä Kansanmusiikki-instituutin nauhoitteista koneoppimismalleille sopiviksi.
Parhaan tuloksen eli 97 prosentin tarkkuuden, saavutti eteenpäin syöttävä neuroverkko, joka hyödyntää Melkelpstrikertoimia, Mel-spektrogrammeja sekä kroma- ja tonnetz-piirteitä.
This playing style stands out from traditional fiddle playing with its syncopated and emphasized rhythms, where the direction of the bow changes in an unconventional manner. In this thesis, several neural network classifiers were presented to identify whether this playing style is present in a recording. The input used were adapted from the original recordings of the Folk Music Institute to be suitable for machine learning models.
The best result, achieving an accuracy of 97%, was obtained with a neural network utilizing Mel-frequency cepstral coefficients, Mel spectrograms, as well as chroma and tonnetz features.
