Bloggarkivering : en jämförelse av insamlingstekniker för långtidsbevaring av bloggar
Sandin, Emil (2011)
Sandin, Emil
Arcada - Nylands svenska yrkeshögskola
2011
All rights reserved
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2011061311850
https://urn.fi/URN:NBN:fi:amk-2011061311850
Tiivistelmä
Bloggar är en vanlig uttrycksform på nätet idag, men den dynamiska uppbyggnaden av bloggar gör insamling och arkivering svårare än för statiska webbsidor. Detta examensarbete undersöker tillgängliga tekniker för insamling av bloggar för långtidsbevaring. Arbetet är gjort för Svenska Litteratursällskapet r.f.
Syftet med arbetet är att ge en översikt av de tekniker som kan användas för insamling av bloggar, samt skillnaderna mellan dessa. En jämförelse av olika tekniker görs med en litteraturkälla som grund för jämförelsen. Den teoretiska delen behandlar långtidsbevaring och de problem som finns, samt bloggens historia, format och tekniska uppbyggnad. Den praktiska jämförelsen görs genom att samla in två bloggar med de olika insamlingsteknikerna för att sedan jämföra det insamlade materialet.
De insamlingstekniker som behandlas i detta arbete är insamling direkt i server eller CMS, insamling med robot, insamling med webbläsare samt insamling av RSS-flöden. Blogs are a common way of expression on the web in today’s world, but their dynamic structure makes collection and archiving harder than for static web pages. This thesis ex-amines available techniques for collection of blogs for long-term preservation. The thesis is written for the Society of Swedish Literature in Finland.
The purpose of this thesis is to give an overview of the techniques that can be used for collection of blogs, and the differences between the techniques. A comparison of differ-ent techniques is made with a literature source as the basis for the comparison. The theo-retical part of the thesis presents long-term preservation and its problems, and also the history, format and structure of blogs. The practical comparison is done by collecting two different blogs, using the different techniques in the comparison, and then comparing the result of the collections.
The different collecting techniques examined in this thesis are collection straight from server or CMS, collection with a crawler, collection within the web browser and collection of RSS-feeds.
Syftet med arbetet är att ge en översikt av de tekniker som kan användas för insamling av bloggar, samt skillnaderna mellan dessa. En jämförelse av olika tekniker görs med en litteraturkälla som grund för jämförelsen. Den teoretiska delen behandlar långtidsbevaring och de problem som finns, samt bloggens historia, format och tekniska uppbyggnad. Den praktiska jämförelsen görs genom att samla in två bloggar med de olika insamlingsteknikerna för att sedan jämföra det insamlade materialet.
De insamlingstekniker som behandlas i detta arbete är insamling direkt i server eller CMS, insamling med robot, insamling med webbläsare samt insamling av RSS-flöden.
The purpose of this thesis is to give an overview of the techniques that can be used for collection of blogs, and the differences between the techniques. A comparison of differ-ent techniques is made with a literature source as the basis for the comparison. The theo-retical part of the thesis presents long-term preservation and its problems, and also the history, format and structure of blogs. The practical comparison is done by collecting two different blogs, using the different techniques in the comparison, and then comparing the result of the collections.
The different collecting techniques examined in this thesis are collection straight from server or CMS, collection with a crawler, collection within the web browser and collection of RSS-feeds.