Datan hallinnan ja tietomallien kehittäminen : vertailututkimus Power BI-optimoinnin, Tabular Editorin, Microsoft Fabricin ja Modulaarisen tietomallin välillä
Hantula, Jonna (2025)
Hantula, Jonna
2025
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2025111428084
https://urn.fi/URN:NBN:fi:amk-2025111428084
Tiivistelmä
Toimeksiantajayrityksen nykyinen informaatioarkkitehtuuri on rakennettu vuosia sitten, kun yritys hallinnoi huomattavasti pienempää määrää dataa ja yrityksen kasvaessa on huomattu, etteivät nykyiset ratkaisut ole riittäviä. Tämän takia yritys on pyytänyt tekemään selvityksen, millä menetelmillä tai järjestelmillä yrityksen tietomalleja ja informaatioarkkitehtuuria voidaan kehittää.
Nykytilan kartoituksessa havaittiin semanttisten mallien muistirajoitusten ylittyvän, relaatioiden määrän olevan suuri, uusien taulujen lisäämisen vaikeaa sekä versionhallinnan ja samanaikaisen kehitystyön puuttuvan. Tutkimuskysymyksiksi nostettiin: millä menetelmillä ja työkaluilla voidaan kehittää datan hallintaa, mikä ratkaisu tukee parhaiten Medallion-arkkitehtuuria ja mikä ratkaisu on kustannustehokkain.
Tutkimus toteutettiin vertailututkimuksena ja siihen valittiin neljä erityyppistä järjestelmää tai tapaa toimia: Power BI -optimointi, Tabular Editor ja Git, Microsoft Fabric sekä Modulaarinen tietomalli ja Data mesh -konsepti. Ratkaisuja arvioitiin seitsemän kriteerin pohjalta, jotka pisteytettiin 1–4 kokonaispisteiden ollessa 28. Tuloksissa Microsoft Fabric sai parhaat pisteet (24/28) mutta oli kallein vaihtoehto. Seuraavina tulivat Power BI -optimointi (18/24), Modulaarinen malli ja Data mesh (17/24) sekä Tabular Editor + Git (14/24).
Medallion-arkkitehtuurin näkökulmasta Microsoft Fabric on vahvin, sillä se kattaa kaikki vaiheet (Bronze, Silver, Gold) ilman, että monimutkaisia laskentoja tarvitsee rakentaa semanttiseen malliin. Power BI Premium, Tabular Editor ja Modulaarinen malli palvelevat lähinnä Gold-tason raportointia. Kustannustehokkuuden näkökulmasta taas Power BI -optimointi ja Tabular Editor + Git tuottavat nopeita hyötyjä ilman merkittäviä lisenssikuluja, kun taas Fabric tarjoaa laajimmat mahdollisuudet skaalautuvuuteen, mutta sen kustannustaso voi olla pienelle tai keskisuurelle organisaatiolle liian korkea suhteessa hyötyihin.
Optimaalinen ratkaisu riippuu kuitenkin yrityksen tavoitteista. Jos painopiste on kustannustehokkuudessa ja olemassa olevien mallien optimoinnissa, Power BI -optimointi ja Tabular Editor + Git ovat perusteltuja. Jos taas halutaan pitkän aikavälin skaalautuva ratkaisu, joka tukee Medallion-arkkitehtuuria ja keskitettyä tiedonhallintaa, Microsoft Fabric on vahvin vaihtoehto, vaikka se edellyttää suurempaa investointia. Hyvä vaihtoehto on myös yhdistää esiteltyjen ratkaisujen vahvuudet, kuten Power BI -optimointi, jonka voi yhdistää Git-versionhallintaan. Tabular Editor nopeuttaa DAX-laskentaa ja Data mesh -ajattelu voisi lisäksi parantaa datan laatua, kun osastot vastaisivat omasta datastaan ja osallistuisivat datatuotteiden kehitykseen.
Nykytilan kartoituksessa havaittiin semanttisten mallien muistirajoitusten ylittyvän, relaatioiden määrän olevan suuri, uusien taulujen lisäämisen vaikeaa sekä versionhallinnan ja samanaikaisen kehitystyön puuttuvan. Tutkimuskysymyksiksi nostettiin: millä menetelmillä ja työkaluilla voidaan kehittää datan hallintaa, mikä ratkaisu tukee parhaiten Medallion-arkkitehtuuria ja mikä ratkaisu on kustannustehokkain.
Tutkimus toteutettiin vertailututkimuksena ja siihen valittiin neljä erityyppistä järjestelmää tai tapaa toimia: Power BI -optimointi, Tabular Editor ja Git, Microsoft Fabric sekä Modulaarinen tietomalli ja Data mesh -konsepti. Ratkaisuja arvioitiin seitsemän kriteerin pohjalta, jotka pisteytettiin 1–4 kokonaispisteiden ollessa 28. Tuloksissa Microsoft Fabric sai parhaat pisteet (24/28) mutta oli kallein vaihtoehto. Seuraavina tulivat Power BI -optimointi (18/24), Modulaarinen malli ja Data mesh (17/24) sekä Tabular Editor + Git (14/24).
Medallion-arkkitehtuurin näkökulmasta Microsoft Fabric on vahvin, sillä se kattaa kaikki vaiheet (Bronze, Silver, Gold) ilman, että monimutkaisia laskentoja tarvitsee rakentaa semanttiseen malliin. Power BI Premium, Tabular Editor ja Modulaarinen malli palvelevat lähinnä Gold-tason raportointia. Kustannustehokkuuden näkökulmasta taas Power BI -optimointi ja Tabular Editor + Git tuottavat nopeita hyötyjä ilman merkittäviä lisenssikuluja, kun taas Fabric tarjoaa laajimmat mahdollisuudet skaalautuvuuteen, mutta sen kustannustaso voi olla pienelle tai keskisuurelle organisaatiolle liian korkea suhteessa hyötyihin.
Optimaalinen ratkaisu riippuu kuitenkin yrityksen tavoitteista. Jos painopiste on kustannustehokkuudessa ja olemassa olevien mallien optimoinnissa, Power BI -optimointi ja Tabular Editor + Git ovat perusteltuja. Jos taas halutaan pitkän aikavälin skaalautuva ratkaisu, joka tukee Medallion-arkkitehtuuria ja keskitettyä tiedonhallintaa, Microsoft Fabric on vahvin vaihtoehto, vaikka se edellyttää suurempaa investointia. Hyvä vaihtoehto on myös yhdistää esiteltyjen ratkaisujen vahvuudet, kuten Power BI -optimointi, jonka voi yhdistää Git-versionhallintaan. Tabular Editor nopeuttaa DAX-laskentaa ja Data mesh -ajattelu voisi lisäksi parantaa datan laatua, kun osastot vastaisivat omasta datastaan ja osallistuisivat datatuotteiden kehitykseen.
