Kennis & expertise

Gemeenschappelijke thesaurus voor uniforme ontsluiting

september 2015 - april 2016

Tussen september 2015 en juni 2016 werd een project rond een gemeenschappelijke thesaurus uitgevoerd door Beeld & Geluid en VIAA. Het project werd gefinancierd door de Taalunie (Commissie Digitaal Erfgoed) en is uitgevoerd met medewerking van Spinque, VRT, het Data Science lab van UGent en de Vrije Universiteit Amsterdam. Het GTUO-eindrapport is vanaf nu en via deze pagina beschikbaar. GTUO staat voor gemeenschappelijke thesaurus uniforme ontsluiting.

Zowel Beeld & Geluid als VIAA beheren een groot digitaal audiovisueel archief dat uit diverse bronnen samengesteld is. Dit archiefmateriaal wordt ontsloten naar diverse doelgroepen zoals onderwijs en onderzoek. Deze zeer uiteenlopende collecties op een uniforme manier ontsluiten is één van de grootste uitdagingen voor beide instellingen.

Een thesaurus is één van de instrumenten die hierbij kunnen helpen. De haalbaarheidsstudie rond unified thesaurus, uitgevoerd in opdracht van VIAA, wees al eerder uit dat linken een realistischer keuze is dan het bouwen van één ‘überthesaurus’. Wanneer bestaande, lokale thesauri gelinkt worden met elkaar ontstaat de opportuniteit om op uniforme wijze door verschillende collecties te zoeken, zonder de eigenheid of het niche karakter van de thesaurus op te moeten geven. Bij Beeld en Geluid is reeds ruime expertise aanwezig met betrekking tot het publiceren van de thesaurus (de GTAA) in het SKOS formaat en ook met linken van thesauri, onder andere in het project CultuurLINK. Met dit project willen we illustreren dat links tussen thesauri niet alleen mogelijkheden bieden op lokaal niveau, maar evenzeer op internationaal niveau.

Er werd onderzocht hoe de verschillende thesauri (de VRT thesaurus en de GTAA) zich verhouden ten opzicht van elkaar en hoe ze gelinkt konden worden. Verder werden tools ontwikkeld om de VRT thesaurus om te zetten naar SKOS en werd de software om links te detecteren verder uitgewerkt. Met behulp van de CultuurLINK tool werden 21.640 links gelegd tussen de twee thesauri.

Als sluitstuk werd een demonstrator gebouwd die illustreert hoe men kan zoeken in collecties op basis van een gelinkte thesaurus. De demonstrator stelt een gebruiker in staat om te zoeken in twee deelcollecties (een selectie van VRT en de OpenBeelden collectie) en om de verbanden tussen de twee collecties te exploreren.

Onderstaande screencast geeft een duidelijk beeld van de demonstrator die gebouwd werd:

In samenwerking met de Taalunie en Beeld & Geluid, en de ondersteuning van Vrije Universiteit Amsterdam, Stad Gent en Spingue.