Hyppää sisältöön
    • Suomeksi
    • På svenska
    • In English
  • Suomi
  • Svenska
  • English
  • Kirjaudu
Hakuohjeet
JavaScript is disabled for your browser. Some features of this site may not work without it.
Näytä viite 
  •   Ammattikorkeakoulut
  • Turun ammattikorkeakoulu
  • Opinnäytetyöt (Avoin kokoelma)
  • Näytä viite
  •   Ammattikorkeakoulut
  • Turun ammattikorkeakoulu
  • Opinnäytetyöt (Avoin kokoelma)
  • Näytä viite

Tietoturvallinen koulutusympäristö itseoppiville suurille kielimalleille

Vilpo, Mika (2025)

 
Avaa tiedosto
Vilpo_Mika.pdf (900.7Kt)
Lataukset: 


Vilpo, Mika
2025
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2025090424409
Tiivistelmä
Tässä opinnäytetyössä kehitettiin tietoturvallinen koulutusalusta suurille kielimalleille (Large Language Models, LLM), joka soveltuu moniasiakasympäristöihin. Tavoitteena oli rakentaa ratkaisu, jossa asiakkaiden data pysyy erillään koko tekoälymallin elinkaaren ajan. Tarve tällaiselle ratkaisulle kasvaa, kun organisaatiot ottavat tekoälyn käyttöönsä mutta kohtaavat tiukkoja tietosuojan ja hallinnan vaatimuksia. Työ vastaa myös EU:n Data Act- ja AI Act -asetusten tuomiin sääntelytarpeisiin.

Toteutus tehtiin hyödyntäen Microsoft Azuren ja Fabricin teknologioita. Arkkitehtuuri perustuu asiakaskohtaisiin Lakehouse-rakenteisiin, Azure Machine Learning -palveluun sekä Retrieval-Augmented Generation (RAG) -menetelmään, joka tuo mallille asiayhteyttä ulkoisista tietolähteistä. Data eriytettiin workspace-tasolla ja yhteisiä komponentteja käytettiin kustannusten hallitsemiseksi. Näin mahdollistettiin jaettujen mallipohjien hyödyntäminen ja asiakaskohtainen konfigurointi turvallisesti.

Lopputuloksena syntyi skaalautuva ja turvallinen alusta tekoälysovellusten koulutukseen ja käyttöön. Työ osoittaa, että suuria kielimalleja voidaan hyödyntää luotettavasti myös ympäristöissä, joissa käsitellään usean asiakkaan arkaluontoista dataa. Kehitetty arkkitehtuuri tarjoaa mallin organisaatioille, jotka rakentavat omia tekoälyratkaisujaan moniasiakaskäyttöön.
 
This thesis presents the development of a secure training platform for Large Language Models (LLMs) in a multi-tenant architecture. The objective was to ensure that customer data remains isolated and protected throughout the AI model lifecycle. The need for such a platform has increased as organizations adopt generative AI while facing stricter requirements for privacy and governance. The solution also aligns with the EU’s Data Act and AI Act, which emphasize transparency and portability.

The platform was implemented using Microsoft Azure and Fabric technologies. Its architecture includes customer-specific Lakehouse environments, Azure Machine Learning for training and version control, and a Retrieval-Augmented Generation (RAG) framework for adding contextual information. Data isolation was achieved through workspace-level separation. Shared components were used to reduce costs while maintaining data security.

The result is a scalable and secure environment for developing and operating AI solutions. This thesis demonstrates that LLMs can be used reliably in settings that involve sensitive multi-tenant data. The proposed architecture provides a practical model for organizations building their own AI systems.
 
Kokoelmat
  • Opinnäytetyöt (Avoin kokoelma)
Ammattikorkeakoulujen opinnäytetyöt ja julkaisut
Yhteydenotto | Tietoa käyttöoikeuksista | Tietosuojailmoitus | Saavutettavuusseloste
 

Selaa kokoelmaa

NimekkeetTekijätJulkaisuajatKoulutusalatAsiasanatUusimmatKokoelmat

Henkilökunnalle

Ammattikorkeakoulujen opinnäytetyöt ja julkaisut
Yhteydenotto | Tietoa käyttöoikeuksista | Tietosuojailmoitus | Saavutettavuusseloste