Verkkoliikenneanalyysi Pythonin tekoälykirjastojen avulla

Hammar, Jarkko

Verkkoliikenneanalyysi Pythonin tekoälykirjastojen avulla

Hammar, Jarkko (2025)

Avaa tiedosto

Hammar_Jarkko.pdf (534.4Kt)

Lataukset:

Hammar, Jarkko

2025

Näytä kaikki kuvailutiedot

Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-202504075840

Tiivistelmä

Tässä työssä tutkittiin koneoppimismallien suorituskykyä verkkohyökkäysten tunnistamisessa käyttämällä CIC-IDS-2017-datasettiä, joka sisältää sekä normaalia verkkoliikennettä että useita eri hyökkäystyyppejä, kuten DDoS, PortScan ja Brute Force. Tavoitteena oli vertailla kolmea erilaista mallia: logistinen regressio, Random Forest (RF) ja monikerroksinen neuroverkko (MLP). Vertailukriteereinä käytettiin tarkkuutta, F1-scorea ja mallien koulutusaikaa.

Kaikki mallit tunnistivat yleiset hyökkäykset (esim. DDoS, DoS Hulk, PortScan) lähes täydellisesti, mutta harvinaisten hyökkäysten (esim. XSS, SQL Injection, Brute Force) tunnistuksessa oli ongelmia erityisesti logistisella regressiolla. Random Forest suoriutui parhaiten myös harvinaisten hyökkäysten osalta. Tulokset osoittivat, että Random Forest on paras valinta verkkohyökkäysten tunnistamiseen, sillä se yhdistää korkean tarkkuuden ja kohtuullisen koulutusajan. Logistinen regressio oli nopein koulututtaa, mutta ei yhtä luotettava hyökkäysten tunnistamisessa. MLP tarjosi hyvän tunnistus tarkkuuden, mutta oli hidas kouluttaa.

Tämä työ osoittaa, että koneoppiminen voi olla tehokas työkalu verkkohyökkäysten torjunnassa, mutta parannuksia tarvitaan erityisesti harvinaisten ja monimutkaisten hyökkäysten tunnistuksessa.

Kokoelmat

Opinnäytetyöt