Verkkoliikenneanalyysi Pythonin tekoälykirjastojen avulla
Hammar, Jarkko (2025)
Hammar, Jarkko
2025
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-202504075840
https://urn.fi/URN:NBN:fi:amk-202504075840
Tiivistelmä
Tässä työssä tutkittiin koneoppimismallien suorituskykyä verkkohyökkäysten tunnistamisessa käyttämällä CIC-IDS-2017-datasettiä, joka sisältää sekä normaalia verkkoliikennettä että useita eri hyökkäystyyppejä, kuten DDoS, PortScan ja Brute Force. Tavoitteena oli vertailla kolmea erilaista mallia: logistinen regressio, Random Forest (RF) ja monikerroksinen neuroverkko (MLP). Vertailukriteereinä käytettiin tarkkuutta, F1-scorea ja mallien koulutusaikaa.
Kaikki mallit tunnistivat yleiset hyökkäykset (esim. DDoS, DoS Hulk, PortScan) lähes täydellisesti, mutta harvinaisten hyökkäysten (esim. XSS, SQL Injection, Brute Force) tunnistuksessa oli ongelmia erityisesti logistisella regressiolla. Random Forest suoriutui parhaiten myös harvinaisten hyökkäysten osalta. Tulokset osoittivat, että Random Forest on paras valinta verkkohyökkäysten tunnistamiseen, sillä se yhdistää korkean tarkkuuden ja kohtuullisen koulutusajan. Logistinen regressio oli nopein koulututtaa, mutta ei yhtä luotettava hyökkäysten tunnistamisessa. MLP tarjosi hyvän tunnistus tarkkuuden, mutta oli hidas kouluttaa.
Tämä työ osoittaa, että koneoppiminen voi olla tehokas työkalu verkkohyökkäysten torjunnassa, mutta parannuksia tarvitaan erityisesti harvinaisten ja monimutkaisten hyökkäysten tunnistuksessa.
Kaikki mallit tunnistivat yleiset hyökkäykset (esim. DDoS, DoS Hulk, PortScan) lähes täydellisesti, mutta harvinaisten hyökkäysten (esim. XSS, SQL Injection, Brute Force) tunnistuksessa oli ongelmia erityisesti logistisella regressiolla. Random Forest suoriutui parhaiten myös harvinaisten hyökkäysten osalta. Tulokset osoittivat, että Random Forest on paras valinta verkkohyökkäysten tunnistamiseen, sillä se yhdistää korkean tarkkuuden ja kohtuullisen koulutusajan. Logistinen regressio oli nopein koulututtaa, mutta ei yhtä luotettava hyökkäysten tunnistamisessa. MLP tarjosi hyvän tunnistus tarkkuuden, mutta oli hidas kouluttaa.
Tämä työ osoittaa, että koneoppiminen voi olla tehokas työkalu verkkohyökkäysten torjunnassa, mutta parannuksia tarvitaan erityisesti harvinaisten ja monimutkaisten hyökkäysten tunnistuksessa.
