Predicting customer purchase intent with machine learning
Vuorio, Emil (2024)
Vuorio, Emil
2024
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2024061122784
https://urn.fi/URN:NBN:fi:amk-2024061122784
Tiivistelmä
Targeted marketing can be enhanced by predicting customer purchase intent. One approach to achieving accurate predictions is by training a Machine Learning model for the problem.
The objective of this thesis was to explore various methods for predicting customer purchase intent, develop a suitable model, and compare the performance differences between BigQueryML and Python. The thesis was commissioned by Verkkokauppa.com Oyj.
The raw data was retrieved from different data sources, and relevant features for the model were created. The data set was then preprocessed using MinMaxScaler, Robust Scaler, and One-Hot Encoder. After preprocessing the data set was ready for training. Supervised Learning was selected as the most appropriate learning category for the problem. Three different Machine Learning algorithms were used to train the model. Logistic Regression, Boosted Tree Classifier, and Random Forest Classifier. The models were evaluated and compared against each other to determine the best performance. Out of the models trained, the Random Forest Classifier performed the best. The result was a functioning Machine Learning model capable of predicting customer purchase intent with promising results. In the future, the model can be further developed and improved by acquiring more data, training the model with more complex algorithms, and creating new features. Kohdennettua mainontaa pystyy tehostamaan ennustamalla asiakkaan ostotodennäköisyyden. Yksi lähestymistapa tarkkaan ennustamiseen on kouluttaa tarkoitukseen sopiva koneoppimisen malli.
Työn tavoitteena oli tutkia lähestymistapoja ostotodennäköisyyksien ennustamiseen, kouluttaa soveltuva malli tehtävään, sekä vertailla BigQueryML- ja Python- työkalujen suorituseroja. Työ suoritettiin toimeksiantona Verkkokauppa.com Oyj:lle.
Raakadata kerättiin eri lähteistä, minkä jälkeen koneoppimisen ominaisuudet mallinnettiin. Tämän jälkeen Data-aineisto esikäsiteltiin MinMax, Robust ja OneHot Encoder -skaalausalgoritmeilla, minkä jälkeen data-aineisto oli valmis käytettäväksi koulutuksessa. Kolme eri koneoppimisen koulutettavaa mallia olivat Logistinen Regressio, Tehostettu Päätöspuu ja Satunnaismetsät. Valmiit mallit arvioitiin, ja parhaiten suoriutui Satunnaismetsät. Tuloksista selvisi, että Pythonilla saavutetaan tarkemmat koulutustulokset ja ostotodennäköisyyksien ennustaminen on mahdollista hyvin tuloksin. Jatkossa työtä voisi jatkokehittää keräämällä lisää dataa, kouluttamalla kompleksisimpiä algoritmeja tai lisäämällä ominaisuuksia data-aineistoon.
The objective of this thesis was to explore various methods for predicting customer purchase intent, develop a suitable model, and compare the performance differences between BigQueryML and Python. The thesis was commissioned by Verkkokauppa.com Oyj.
The raw data was retrieved from different data sources, and relevant features for the model were created. The data set was then preprocessed using MinMaxScaler, Robust Scaler, and One-Hot Encoder. After preprocessing the data set was ready for training. Supervised Learning was selected as the most appropriate learning category for the problem. Three different Machine Learning algorithms were used to train the model. Logistic Regression, Boosted Tree Classifier, and Random Forest Classifier. The models were evaluated and compared against each other to determine the best performance. Out of the models trained, the Random Forest Classifier performed the best. The result was a functioning Machine Learning model capable of predicting customer purchase intent with promising results. In the future, the model can be further developed and improved by acquiring more data, training the model with more complex algorithms, and creating new features.
Työn tavoitteena oli tutkia lähestymistapoja ostotodennäköisyyksien ennustamiseen, kouluttaa soveltuva malli tehtävään, sekä vertailla BigQueryML- ja Python- työkalujen suorituseroja. Työ suoritettiin toimeksiantona Verkkokauppa.com Oyj:lle.
Raakadata kerättiin eri lähteistä, minkä jälkeen koneoppimisen ominaisuudet mallinnettiin. Tämän jälkeen Data-aineisto esikäsiteltiin MinMax, Robust ja OneHot Encoder -skaalausalgoritmeilla, minkä jälkeen data-aineisto oli valmis käytettäväksi koulutuksessa. Kolme eri koneoppimisen koulutettavaa mallia olivat Logistinen Regressio, Tehostettu Päätöspuu ja Satunnaismetsät. Valmiit mallit arvioitiin, ja parhaiten suoriutui Satunnaismetsät. Tuloksista selvisi, että Pythonilla saavutetaan tarkemmat koulutustulokset ja ostotodennäköisyyksien ennustaminen on mahdollista hyvin tuloksin. Jatkossa työtä voisi jatkokehittää keräämällä lisää dataa, kouluttamalla kompleksisimpiä algoritmeja tai lisäämällä ominaisuuksia data-aineistoon.