dc.contributor.author | Alto, Olga | |
dc.date.accessioned | 2019-06-12T10:30:37Z | |
dc.date.available | 2019-06-12T10:30:37Z | |
dc.date.issued | 2019 | - |
dc.identifier.uri | http://www.theseus.fi/handle/10024/221259 | |
dc.description.abstract | Tämän opinnäytetyön tarkoituksena on selvittää, mitä tietoja voidaan ennustaa suurista tietomääristä. Aineistona on käytetty Suomessa liikennetapaturmia koskevia avoimia lähteitä vuosilta 2015 – 2017.
Työssä ennustetaan liikenneonnettomuuksien tulevia arvoja vuonna 2018. Regressioanalyysin avulla arvioitiin kuljettajan iän, ajokokemuksen ja nopeusrajoitusten vaikutusta loukkaantuneiden lukumäärään liikenneonnettomuuksissa. Luottamusväli luotiin, jotta voitaisiin arvioida uhrien lukumäärä tieliikenneonnettomuuksissa kuljettajan iän ja ajokokemuksen mukaan.
Tutkimuksessa ennustettiin, että tieliikenneonnettomuuksien määrä vuonna 2018 pysyi vuoden 2017 tasolla, mutta vähemmän kuin vuosina 2015-2016.
Regressioanalyysin avulla todettiin, että ajokokemuksella on vahva vaikutus uhrien määrään. Liikenneonnettomuudet vaikuttavat paljon nuorempiin kuljettajiin, joilla on vähän ajokokemusta. Ikääntyneihin kuljettajiin tämä vaikutus vähenee. Nopeusrajoitusten ja uhrien lukumäärän suhdetta regressiomalleja verrattaessa pidettiin heikkona.
Regressioanalyysin aikana luotiin luottamusväliä ennustetulle uhrien määrälle 19-vuotiaalla kuljettajalla, jolla oli yhden vuoden ajokokemus, 30-vuotias kuljettaja, jolla on yhdeksän vuoden kokemus, 50-vuotias kuljettaja, jolla on 19 vuoden kokemus. Ennusteiden mukaan luottamusväli laskee (uhrien määrä pienenee), kun ajokokemus ja kuljettajan ikä kasvaavat. Niinpä, käyttämällä regressioanalyysiä ja rakentamalla luottamusvälejä ennustetun uhrien lukumäärän kanssa, voidaan päätellä, että ajokokemus ja kuljettajan ikä vaikuttavat suuresti uhrien määrään.
Tutkimuksen tulos voi olla hyödyllistä vakuutusyhtiölle vakuutusriskien arvioinnissa ja vakuutuskustannusten laskemisessa.
Tutkimus suoritettiin R-ohjelmointikielellä RStudio-ympäristössä. Työssä käytettiin tilastotietoja, ohjelmointia, tiedon louhintamenetelmiä. | - |
dc.description.abstract | The purpose of this thesis is to find out what information can be predicted from large amounts of data, for which open data on road traffic accidents in Finland in 2015 – 2017 has been used.
The study predicted the future values of traffic accidents in 2018. Using the regression analysis, the influence of the driver’s age, driving experience and speed limits on the number of people injured in road traffic accidents is estimated. 95 % confidence intervals were built to estimate the number of victims, depending on the set age and driving experience.
The study predicted that the number of road accidents in 2018 remained at the 2017 level, but less than in 2015-2016.
Regression analysis found that driving experience has a strong impact on the number of victims. Traffic accidents affect much younger drivers with little driving experience. For older drivers, this effect is reduced. The relationship between speed limits and the number of victims compared to regression models was considered weak.
During the regression analysis, a confidence interval was created for the predicted number of victims with a 19-year-old driver with a one-year driving experience, a 30-year-old driver with nine years experience, a 50-year-old driver with 19 years of experience. According to forecasts, the confidence interval will decrease (the number of victims will decrease) as the driving experience and driver age increase. Thus, by using regression analysis and building confidence intervals with the predicted number of victims, it can be concluded that the driving experience and driver age have a major impact on the number of victims.
The result of the study may be useful for the insurance company in assessing insurance risks and calculating insurance costs.
The research was conducted in the R programming language in RStudio and used information about statistics, programming, date mining methods. | en |
dc.language.iso | fin | - |
dc.rights | fi=All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.|sv=All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.|en=All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.| | - |
dc.title | Big datan käyttö liiketoiminnan ennustamiseen: tieliikenneonnettomuudet Suomessa | - |
dc.type.ontasot | fi=AMK-opinnäytetyö|sv=YH-examensarbete|en=Bachelor's thesis| | - |
dc.identifier.urn | URN:NBN:fi:amk-2019061216609 | - |
dc.subject.specialization | Talous, hallinto ja markkinointi | - |
dc.subject.degreeprogram | fi=Liiketalous, hallinto ja markkinointi|sv=Företagsekonomi, förvaltning och marknadsföring|en=Business Management, Administration and Marketing| | - |
dc.subject.yso | massadata | - |
dc.subject.yso | avoin data | - |
dc.subject.yso | data-analyysi | - |
dc.subject.yso | tiedonlouhinta | - |
dc.subject.yso | R-ohjelmointikieli | - |
dc.subject.yso | Big data | - |
dc.subject.yso | open data | - |
dc.subject.yso | data analysis | - |
dc.subject.yso | data mining | - |
dc.subject.yso | R programming language | - |
dc.subject.discipline | Liiketalouden koulutus | - |