Tietovarastoratkaisun valintakriteeristö
Erkinheimo, Tuula (2015)
Erkinheimo, Tuula
Haaga-Helia ammattikorkeakoulu
2015
All rights reserved
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2015113018465
https://urn.fi/URN:NBN:fi:amk-2015113018465
Tiivistelmä
Tutkimuksessa on tuotettu tietoa, jonka avulla on tiivistetty tietovarastoratkaisun valinnassa huomioon otettavat seikat kriteeristöksi. Kriteeristö on tarkoitettu käytännön apuvälineeksi tietovarastoratkaisujen valintatilanteissa. Tutkimuksessa on etsitty kriteeristölle teoreettisia perusteluja sekä kartoitettu erityisesti uusia tietovarastovaihtoehtoja joita on luotu Big Data – lähestymistavan myötä.
Tiedon käsittelyn tarpeet vaihtelevat saatavuuden, yksilöimisen/yksilöimättömyyden sekä kirjoitus-/lukuoperaatioiden painottumisen perusteella. Big Data ilmiönä on tuonut uudenlaisen lähestymistavan tiedon varastointiin ja tuonut uusia välineitä laajojen, vaihtelevien ja monimuotoisten tietomassojen käsittelyyn. Erityyppisillä tietovarastoratkaisuilla on erilaisia ominaisuuksia, jotka tukevat erilaisia tiedon käsittelytarpeita.
Tietomallit ovat kehittyneet ajan myötä. Nykyään käytetyin tietomalli on relaatiomalli. Erilaisia tietomalleja ovat mm. hierarkkinen tietomalli, verkkotietomalli, relaatiomalli, oliomalli sekä tietomallit, joita NoSQL- tietovarastoissa käytetään. NoSQL – tietovarastotyyppejä on kehitetty 2000-luvulla vastaamaan Big Data -ilmiön ja pilvipalveluiden tarpeita. NoSQL – termillä viitataan tietovarastoihin, joiden käsittelyyn SQL-kieli ei ole ainoa vaihtoehto. NoSQL-tietovarastojen tyypillisiä ominaisuuksia ovat tiedon skaalautuvuus horisontaalisesti useille palvelimille, relaatiotietokantojen tapahtumankäsittelyn eheys- ja turvallisuusominaisuuksista tinkiminen suorituskyvyn ja laajennettavuuden vuoksi sekä relaatiotietokantoja parempi tuki ei-strukturoidulle tiedolle. NoSQL-tietovarastot ovat usein skeemattomia tai niissä on joustava skeema. NoSQL-tietovarastoja voidaan luokitella tietomallien mukaan. Eräs yleisesti käytetty luokittelu on jako avain-arvo-varastoihin, sarakeperhevarastoihin, dokumenttivarastoihin ja verkko- l. graafitietovarastoihin.
Organisaation tulee harkita tarvitaanko tietovarastoa tapahtumankäsittelyyn. Relaatiotietokantojen hallintajärjestelmät sisältävät yleensä tapahtumien hallintaominaisuuksia. Jollei tietovarastoratkaisu sisällä tapahtumanhallinnan tukea ja tiedon käsittelytarve edellyttää sitä, tapahtumanhallinta täytyy toteuttaa sovelluslogiikan tasolla. Tietovarastoratkaisun valintakriteerit johtuvat kuitenkin pitkälti tietovaraston ulkopuolisista seikoista. Tietohallintostrategia, teknologian kypsyys, osaamisen saatavuus, markkinatilanne, liiketoimintatarpeet ja muu kokonaisarkkitehtuuri sekä käytettävät tiedonsiirtoformaatit ovat asioita jotka vaikuttavat tietovarastoratkaisun valintaan. Organisaation keskeisimpänä tehtävänä on näiden elementtien lähtökohtien, painopisteiden ja kehittämistarpeiden tunnistaminen. Organisaatiossa täytyy tunnistaa myös se osaaminen jota tarvitaan näiden elementtien hahmottamiseen kulloisessakin ratkaisutilanteessa.
Tiedon käsittelyn tarpeet vaihtelevat saatavuuden, yksilöimisen/yksilöimättömyyden sekä kirjoitus-/lukuoperaatioiden painottumisen perusteella. Big Data ilmiönä on tuonut uudenlaisen lähestymistavan tiedon varastointiin ja tuonut uusia välineitä laajojen, vaihtelevien ja monimuotoisten tietomassojen käsittelyyn. Erityyppisillä tietovarastoratkaisuilla on erilaisia ominaisuuksia, jotka tukevat erilaisia tiedon käsittelytarpeita.
Tietomallit ovat kehittyneet ajan myötä. Nykyään käytetyin tietomalli on relaatiomalli. Erilaisia tietomalleja ovat mm. hierarkkinen tietomalli, verkkotietomalli, relaatiomalli, oliomalli sekä tietomallit, joita NoSQL- tietovarastoissa käytetään. NoSQL – tietovarastotyyppejä on kehitetty 2000-luvulla vastaamaan Big Data -ilmiön ja pilvipalveluiden tarpeita. NoSQL – termillä viitataan tietovarastoihin, joiden käsittelyyn SQL-kieli ei ole ainoa vaihtoehto. NoSQL-tietovarastojen tyypillisiä ominaisuuksia ovat tiedon skaalautuvuus horisontaalisesti useille palvelimille, relaatiotietokantojen tapahtumankäsittelyn eheys- ja turvallisuusominaisuuksista tinkiminen suorituskyvyn ja laajennettavuuden vuoksi sekä relaatiotietokantoja parempi tuki ei-strukturoidulle tiedolle. NoSQL-tietovarastot ovat usein skeemattomia tai niissä on joustava skeema. NoSQL-tietovarastoja voidaan luokitella tietomallien mukaan. Eräs yleisesti käytetty luokittelu on jako avain-arvo-varastoihin, sarakeperhevarastoihin, dokumenttivarastoihin ja verkko- l. graafitietovarastoihin.
Organisaation tulee harkita tarvitaanko tietovarastoa tapahtumankäsittelyyn. Relaatiotietokantojen hallintajärjestelmät sisältävät yleensä tapahtumien hallintaominaisuuksia. Jollei tietovarastoratkaisu sisällä tapahtumanhallinnan tukea ja tiedon käsittelytarve edellyttää sitä, tapahtumanhallinta täytyy toteuttaa sovelluslogiikan tasolla. Tietovarastoratkaisun valintakriteerit johtuvat kuitenkin pitkälti tietovaraston ulkopuolisista seikoista. Tietohallintostrategia, teknologian kypsyys, osaamisen saatavuus, markkinatilanne, liiketoimintatarpeet ja muu kokonaisarkkitehtuuri sekä käytettävät tiedonsiirtoformaatit ovat asioita jotka vaikuttavat tietovarastoratkaisun valintaan. Organisaation keskeisimpänä tehtävänä on näiden elementtien lähtökohtien, painopisteiden ja kehittämistarpeiden tunnistaminen. Organisaatiossa täytyy tunnistaa myös se osaaminen jota tarvitaan näiden elementtien hahmottamiseen kulloisessakin ratkaisutilanteessa.