Hyppää sisältöön
    • Suomeksi
    • På svenska
    • In English
  • Suomi
  • Svenska
  • English
  • Kirjaudu
Hakuohjeet
JavaScript is disabled for your browser. Some features of this site may not work without it.
Näytä viite 
  •   Ammattikorkeakoulut
  • Metropolia Ammattikorkeakoulu
  • Opinnäytetyöt
  • Näytä viite
  •   Ammattikorkeakoulut
  • Metropolia Ammattikorkeakoulu
  • Opinnäytetyöt
  • Näytä viite

Near-real-time data pipeline using change data capture approach

Huang, Zhongming (2024)

 
Avaa tiedosto
Huang_Zhongming.pdf (1.756Mt)
Lataukset: 


Huang, Zhongming
2024
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2024060420803
Tiivistelmä
This study focused on designing and developing a near-real-time data pipeline, leveraging the Change Data Capture (CDC) approach to achieve real-time reporting for an online transaction processing business.

The company was required to report the financial transactions in near-real-time to the regulator for auditing and compliance purposes. However, the existing system was constrained, capable only of dispatching reports the following morning, and the reporting feature was coupled with the online transaction system. It was challenging to add the real-time reporting feature to the existing system.

This thesis explored the methodology known as CDC to streamline the transfer of transactional data to an analytical database, enabling the generation and delivery of reports in near-real-time. This approach successfully fulfilled the legal requirements for timely and accurate financial reporting.

Firstly, it investigated different technologies in this domain, including Apache Kafka, Debezium, Kafka Streams, ClickHouse, Prometheus, and Grafana.

Secondly, a production-ready data pipeline solution was built based on the selected platform and framework. This platform achieved 0.6 seconds of average end-to-end latency and about 30 thousand records per second of average throughput, and the performance fulfilled the business requirements of reporting the transactions in 5 minutes and demonstrated stability in its operation.

Potential enhancements and refinements to the system were also identified and discussed.
Kokoelmat
  • Opinnäytetyöt

Samankaltainen aineisto

Näytetään aineisto, joilla on samankaltaisia nimekkeitä, tekijöitä tai asiasanoja.

  • Data Strategy Handbook as Guide Towards Data-Driven Organization 

    Piippola, Timo-Joel (2024)
    The need for an organizational data culture is evident in the digital era. More organizations are making data-driven decisions, viewing data as a crucial business asset. This thesis aimed to help a case company enhance its ...
  • Big datan käyttö liiketoiminnan ennustamiseen: tieliikenneonnettomuudet Suomessa 

    Alto, Olga (2019)
    Tämän opinnäytetyön tarkoituksena on selvittää, mitä tietoja voidaan ennustaa suurista tietomääristä. Aineistona on käytetty Suomessa liikennetapaturmia koskevia avoimia lähteitä vuosilta 2015 – 2017. Työssä ennustetaan ...
  • Recognizing the value of data in business operations : Data analytics for business operation 

    Duma, Don (2022)
    The aim of this study was to demonstrate the hidden value of data that can be extracted with few commercial and open-source software tools. Any given business can collect, organize, and extract data for analysis that can ...
Ammattikorkeakoulujen opinnäytetyöt ja julkaisut
Yhteydenotto | Tietoa käyttöoikeuksista | Tietosuojailmoitus | Saavutettavuusseloste
 

Selaa kokoelmaa

NimekkeetTekijätJulkaisuajatKoulutusalatAsiasanatUusimmatKokoelmat

Henkilökunnalle

Ammattikorkeakoulujen opinnäytetyöt ja julkaisut
Yhteydenotto | Tietoa käyttöoikeuksista | Tietosuojailmoitus | Saavutettavuusseloste