Designing a Data Platform Consolidation: A Case Study
Harjunpää, Niklas (2020)
Lataukset:
Harjunpää, Niklas
2020
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2020121729010
https://urn.fi/URN:NBN:fi:amk-2020121729010
Tiivistelmä
This thesis focuses on gathering the necessary information to be able to design a consolidation of data use cases between the different data platforms, and also proposes a possible future solution for the data platforms. As a result, this will help the case company increase their understanding of these different data platforms and to find potential overlaps between them. This thesis does not take a position on technology choices. The methods used to collect the use cases is a combination of different qualitative methods, such as documentation analysis, in-depth interviews and single question surveys. The different data platforms at use at the case company consists of data warehouses and data lakes. To perform the consolidation, an in-depth data comparison was done on a use case level, comparing strategic business goals, data endpoints and visualization purposes. The results show that there are potential overlaps between the case company’s different data platforms. In addition to gathering the data and showing potential overlaps, the thesis provides two different solutions for consolidation on a theoretical level. Both solutions strive to preserve all the use cases and their own functionalities, but have their own benefits and shortcomings. If one would want to implement either of the designed solutions, a deeper research for each for each data use case would be necessary, as well as a technical feasibility study Examensarbetet fokuserar på att samla in nödvändig information för att kunna planera en konsolidering av dataanvändningsfall mellan de olika dataplattformarna och föreslå en möjlig framtida lösning för dataplattformarna. Resultatet kommer att hjälpa företaget att öka sin förståelse för de olika dataplattformarna och att hitta potentiella överlappningar mellan dem. Examensarbetet tar inte ställning till teknologival. För att samla in användningsfallen användes olika kvalitativa metoder, såsom dokumentationsanalys, fördjupande intervjuer och enkäter. Fallföretagets dataplattformar består av data warehouses och data lakes. För att kunna planera konsolideringen, utfördes en djupgående jämförelse av verksamhetens målsättningar, dataändpunkter och visualiseringsändamål mellan dataanvändningsfallen. Resultatet visar att det finns potentiella överlappningar mellan fallföretagets olika dataplattformar. Förutom att samla in nödvändig information och visa potentiella överlappningar, ger examensarbetet två olika teoretiska lösningar för konsolidering. Båda lösningarna strävar efter att bevara alla användningsfall och deras funktionaliteter, men har sina egna för- och nackdelar. Ifall man skulle vilja implementera någondera av lösningarna, skulle både en djupare forskning för varje dataanvändningsfall och en teknisk genomförbarhetsstudie vara nödvändig.