Automating website crawling using web scraping techniques provided by PHP
Haralson, Dmitriy (2016)
Haralson, Dmitriy
Metropolia Ammattikorkeakoulu
2016
All rights reserved
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-201605259673
https://urn.fi/URN:NBN:fi:amk-201605259673
Tiivistelmä
Insinöörityön tarkoituksena oli rakentaa moduuli nettikehitysalustalle nimeltä Pro5. Moduulin toimintaan kuuluu mahdollisen asiakkaan nettisivulla käynti ja tärkeiden tietojen keruu verkkosivulta, kuten sivujen ja sanojen määrä.
Moduulia toteutetaan PHP:lla käyttäen PHP:n päälle rakennettua runkokirjastoa nimeltä Yii2, josta hyödynnetään tietokantaominaisuudet. Verkkokaavintaosuuden mahdollistaa PHP:n sisään rakennettu DOM-rakenteen jäsennin. Tietokantatekniikkana toimii MySQL. Projektin luonteen takia ohjelmointityyli oli hyvin oliomainen.
Insinöörityössä toteutettiin integraatiovalmis moduuli Pro5-kehihitysalsutaan. Toteutettu moduuli kaapii melko tarkasti nettisivuja, joilla se käy.
Moduulia toteutetaan PHP:lla käyttäen PHP:n päälle rakennettua runkokirjastoa nimeltä Yii2, josta hyödynnetään tietokantaominaisuudet. Verkkokaavintaosuuden mahdollistaa PHP:n sisään rakennettu DOM-rakenteen jäsennin. Tietokantatekniikkana toimii MySQL. Projektin luonteen takia ohjelmointityyli oli hyvin oliomainen.
Insinöörityössä toteutettiin integraatiovalmis moduuli Pro5-kehihitysalsutaan. Toteutettu moduuli kaapii melko tarkasti nettisivuja, joilla se käy.