Wat doen we?

Oorlogskranten verrijken met linked data

Hoe kan linked data ervoor zorgen dat een krantendatabank beter vindbaar of beter doorzoekbaar wordt? Wat is linked data eigenlijk en zijn er nog meer voordelen aan? Wij zochten het in 2018 zelf uit. Hier lees je wat wij ontdekten en hoe we het toegepast hebben.

Wat is linked data?

Linked data betekent dat je relaties legt tussen dingen - data dus - op het internet. Door je data eerst gestructureerd te publiceren, kan je daarna koppelingen leggen tussen de data of kunnen derden dat doen - of dat nu machines of mensen zijn. Daardoor kan je er beter semantische zoekopdrachten op verrichten. Met andere woorden, door de data aan elkaar te linken, spreken databanken dezelfde taal en begrijpen ze elkaar beter. Met webtechnologieën stellen we data zo beschikbaar dat ze automatisch door computers kunnen worden gelezen. Data die met andere data worden verbonden, noemen we linked data. 

Concreet: zoek je online op termen als ‘Albert I van België’ en ‘Albert Leopold Clemens Marie Meinrad’, dan krijg je (gedeeltelijk) andere zoekresultaten, terwijl het toch om dezelfde persoon gaat. De oorzaak van die verschillende resultaten is dat webdocumenten wel met elkaar gekoppeld zijn, maar de inhoud van die documenten niet. Met linked data kun je ook inhoud van de documenten aan elkaar koppelen en zou je dus dezelfde zoekresultaten moeten vinden. 

Wat kan je met linked data doen?

Je website of databank verrijken met linked data heeft verschillende voordelen. Allereerst is je data eenvoudiger doorzoekbaar en vindbaar voor machines, zoals zoekmachines, omdat zij de structuur van je data begrijpen. Zo kan een zoekmachine als Google een aantal zaken vanop je website uitlichten in zijn zoekresultaten, zoals je adres, openingsuren of belangrijke werken in je collectie. 

Door inhoudelijke koppelingen te leggen, plaats je je data in een brede context. Zo zijn persoonsnamen uit krantenartikels van Nieuws van de Groote Oorlog nu gekoppeld aan namen uit De Namenlijst van het In Flanders Fields Museum. Daardoor kan ook biografische informatie over de personen (zoals het beroep, de naam van de ouders, de geboortedatum en -plaats en de overlijdensdatum en -plaats) die niet vervat zit in de krantenartikels toch worden weergegeven. Een duidelijke inhoudelijke verrijking dus. Bovendien kan iedereen de data interpreteren en, afhankelijk van de licentie, hergebruiken - binnen de eigen organisatie en daarbuiten. Daarbij word je niet gehinderd doordat de data niet duidelijk beschreven zijn (bijvoorbeeld aan de hand van eigen parameters) of doordat ze moeilijk toegankelijk zijn (bijvoorbeeld gepubliceerd in een Excel-document). De data zijn evenwel niet zomaar ‘open’. Zo gelden op de ocr - de eigenlijke teksten - van onze krantencollectie nog steeds de gebruiksvoorwaarden van Het Archief. 

Linked data verhoogt ook de uitwisselbaarheid van je data. Het is een standaard geworden bij het uitwisselen van data. Belangrijke internationale platformen voor de uitwisseling van data, zoals Europeana en de Wikidata, maken vandaag gebruik van linked data.