Hyppää sisältöön
    • Suomeksi
    • På svenska
    • In English
  • Suomi
  • Svenska
  • English
  • Kirjaudu
Hakuohjeet
JavaScript is disabled for your browser. Some features of this site may not work without it.
Näytä viite 
  •   Ammattikorkeakoulut
  • Oulun ammattikorkeakoulu
  • Opinnäytetyöt (Avoin kokoelma)
  • Näytä viite
  •   Ammattikorkeakoulut
  • Oulun ammattikorkeakoulu
  • Opinnäytetyöt (Avoin kokoelma)
  • Näytä viite

The Impact of Accessibility of Education on Youth Unemployment : a prediction model using machine learning

Forsell, Peter (2025)

 
Avaa tiedosto
Forsell_Peter.pdf (2.174Mt)
Lataukset: 

Avoin saatavuus / Open access / Öppen tillgång
Forsell, Peter
2025
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2025120432538
Tiivistelmä
Tässä tutkimuksessa tarkasteltiin, onko kunnan tasolla mitattavalla toisen asteen koulutuksen saavutettavuudella yhteyttä nuorisotyöttömyyteen Suomessa. Työtä motivoivat alueelliset erot koulutusmahdollisuuksissa ja työmarkkinatuloksissa sekä ajankohtainen ammatillista koulutusta koskeva koulutuspoliittinen keskustelu. Tavoitteena oli arvioida tämän yhteyden suunta ja voimakkuus sekä testata yleisesti käytettyjen koneoppimismenetelmien soveltuvuutta kuntatason ennustamiseen.

Analyysiä varten koottiin yhdistetty aineisto suomalaisista viranomaislähteistä: oppilaitosten lukumäärät koulutusmuodoittain, kuntien kokonaisväestö, pinta-alatiedot sekä nuorisotyöttömyystilastot. Kuntien nimet yhdenmukaistettiin, minkä jälkeen johdettiin väestötiheys ja oppilaitosten määrä 10 000 asukasta kohden. Nuorisotyöttömien määrä 10 000 asukasta kohden määriteltiin selitettäväksi muuttujaksi. Aineistolle tehtiin peruspuhdistus ja poikkeavien havaintojen tarkastelu.

Samoilla selittävillä muuttujilla opetettiin kaksi regressiomallia. K-lähimmän naapurin menetelmään perustuva malli toimi yksinkertaisena, vähäoletuksisena vertailukohtana, ja satunnaismetsämallilla pyrittiin mallintamaan mahdollisia ei-lineaarisia riippuvuuksia ja yhteisvaikutuksia. Mallien hyperparametrit viritettiin ristiinvalidoinnilla, ja suorituskykyä arvioitiin erillisellä testiaineistolla.

Kun kunnan väkiluku ja väestötiheys vakioitiin, molempien mallien mukaan koulutusverkoston tiheydellä oli vain heikko negatiivinen yhteys nuorisotyöttömyyteen. Ennustetarkkuus jäi vaatimattomaksi, vaikka satunnaismetsä suoriutui k-lähimpien naapureiden mallia paremmin. Tulosten perusteella koulutuksen saavutettavuus sisältää informaatiota, mutta ei yksin selitä kuntien välisiä eroja; ennustetarkkuuden parantaminen edellyttää pikemminkin sosioekonomisia, spatiaalista rakennetta ja työvoiman kysyntää kuvaavia muuttujia kuin nykyistä monimutkaisempia malleja.
 
This thesis examined whether municipal access to upper-secondary education is associated with youth unemployment in Finland. The work was motivated by regional disparities in study opportunities and labour-market outcomes, and by current policy debates on vocational education. The aim was to estimate the strength and direction of this association and to test the suitability of common machine learning methods for municipal-level prediction.

A combined dataset was built from official Finnish sources: education institution counts by type, municipal population totals, land-area data, and youth-unemployment figures. After harmonising municipality names, population density and institutions per 10 000 residents were derived, and youth unemployed per 10 000 residents was defined as the target. Basic cleaning and outlier screening were carried out.

Two regression models were trained on the same features. A k-nearest neighbours model served as a simple, assumption-light baseline; a random forest was used to model possible non-linear and interaction effects. Hyperparameters were tuned by cross-validation, and performance was evaluated on a held-out test set.

Both models found only a weak negative association between education-network density and youth unemployment once population size and density were controlled for. Predictive accuracy stayed modest, although the random forest improved on k-NN. It is concluded that educational accessibility contains signal but does not, on its own, explain municipal differences; further gains will require adding socio-economic, spatial, and labour-demand variables rather than increasing model complexity.
 
Kokoelmat
  • Opinnäytetyöt (Avoin kokoelma)
Ammattikorkeakoulujen opinnäytetyöt ja julkaisut
Yhteydenotto | Tietoa käyttöoikeuksista | Tietosuojailmoitus | Saavutettavuusseloste
 

Selaa kokoelmaa

NimekkeetTekijätJulkaisuajatKoulutusalatAsiasanatUusimmatKokoelmat

Henkilökunnalle

Ammattikorkeakoulujen opinnäytetyöt ja julkaisut
Yhteydenotto | Tietoa käyttöoikeuksista | Tietosuojailmoitus | Saavutettavuusseloste