Koploper met pilot Linked Open Data van de Bibliotheek en CREATE

12 januari 2023

Het afgelopen jaar hebben de UvA Bibliotheek en het UvA CREATE Lab samengewerkt aan een Linked Open Datapilot. Met deze pilot profileert de UvA zich als voorloper op dit gebied. Er zijn nog nauwelijks bibliotheken of uitgevers die onderzoeksdata als bruikbare Linked Open Data (LOD) publiceren en daarmee onderzoeksdata voor een langere termijn beschikbaar maken als LOD.

Het pilotproject bestaat uit het als Linked Open Data beschikbaar stellen van drie bestaande datasets die voortkomen uit onderzoek naar culturele programma’s in Amsterdam door CREATE (Mediastudies UvA).

Samen met het UvA CREATE Lab hebben onze ICT- en metadataspecialisten een mooi project gerealiseerd. Deze nieuwe manier om digitale onderzoeksdata te ontsluiten is een goed voorbeeld van samenwerking tussen onderzoekers en de Bibliotheek en hoe deze bijdraagt aan wetenschap en onderwijs. Max Haring, hoofd Onderwijs en Onderzoek van de Bibliotheek

Een waardevolle erkenning is dat de pilot werd genomineerd voor de Dutch Data Prize 2022, een Nederlandse Dataprijs die om de twee jaar wordt uitgereikt aan een individu of een team dat onderzoeksdata FAIR maakt (Findable, Accessible, Interoperable, Reusable).

Tekening van het Rembrandt theater als getoond op de pagina van Cinema Context — Rembrandt theater (webite Cinema Context)

1 Cinema Context is een online encyclopedie van de film(cultuur) in Nederland vanaf 1896. Het is een database met historische én hedendaagse filmtheaters in Nederland, en de meer dan 100.000 filmvertoningen sinds die periode. Je krijgt hiermee inzicht in het DNA van de Nederlandse film- en bioscoopcultuur en een deel van het culturele leven van Nederland.

De Linked Data van Cinema Context zijn tot stand gekomen met behulp van een subsidie van KNAW DANS. Hoe de data zijn gemodelleerd en wat je vervolgens met de data kunt (via voorbeeldquery's) is te vinden op https://uvacreate.gitlab.io/cinema-context/cinema-context-rdf/.

Scene uit Bredero's Lucelle door Jan Miense Molenaer (1636) zoals getoond op de pagina van Onstage — Scene uit Bredero's Lucelle door Jan Miense Molenaer (1636)

2 Onstage bevat alle voorstellingen, inkomsten en culturele programma's in de Amsterdamse openbare schouwburg in de 17e tot de 18e eeuw. Hierin vind je van alle theaterprogramma’s, de opgevoerde stukken per dag, namen van acteurs en vertalers tot aan zelfs de inkomsten door de tijd heen.

De Linked Data van Onstage en Ecartico zijn geïntegreerd in de websites van de twee datasets. Beide datasets zijn verder uitgebreid en doorontwikkeld door de UvA in het Golden Agents project.

Detail uit schilderij van een vrouwelijk figuur met haar arm op een wereldbol en achterhaar een mannelijk figuur met engelenvleugels zoals getoond op de pagina van Ecartico — Detail Ecartico

3 Ecartico is een database met biografische informatie van mensen die betrokken waren bij de culturele sector in Amsterdam in de 16e-18e eeuw: kunstenaars, schilders, acteurs, zaaleigenaren, etc. Je kunt meer dan alleen zoeken en bladeren naar gegevens over personen of selecties maken van bepaalde soorten gegevens. Met Ecartico kun je ook gegevens over culturele ondernemers en hun 'milieus' visualiseren en analyseren.

A Midsummernight's Dream

Alle drie de databases zijn afzonderlijk te gebruiken, maar in deze pilot brengen we alle data samen en stellen deze open voor bredere analyse.

Zo zie je dat 'A Midsummernight's Dream' in een Nederlandse bewerking niet alleen een toneelstuk is dat in de 17e eeuw minstens eenmaal per jaar in het openbare theater werd opgevoerd, maar ook dat het de titel is van een film uit 1935 die verschillende keren is vertoond in Nederlandse steden. Ook kun je namen vinden van de 17e-eeuwse vertalers en de sociale netwerken die deze voorstellingen mogelijk maakten. Op het moment dat deze datasets aan elkaar worden gekoppeld, ontstaan nieuwe mogelijkheden voor onderzoek.

Voorbeelden
Cinema Context: Midsummer night's dream, A (1935 USA)	Cinema Context: Midsummer night's dream, A (1935 USA) - in LOD-browser
Onstage: Midsummernight's Dream	Onstage: Midsummernight’s Dream – in LOD-browser
En daarvan de vertaling Piramus en Thisbe, of De bedrooge hartog van Pierlepon, boertige tragedie	En daarvan de vertaling Piramus en Thisbe, of De bedrooge hartog van Pierlepon, boertige tragedie – in LOD-browser
Ecartico: Matthijs Gramsbergen	Ecartico: Matthijs Gramsbergen in LOD-browser

Downloaden overbodig

Deze drie gekoppelde open datasets hebben duidelijke voordelen ten opzichte van hun afzonderlijke dataset-iteraties: geen databankbestanden meer downloaden.

Het is bijvoorbeeld mogelijk om naar een enkele persoon in een dataset te verwijzen en zijn of haar data te gebruiken zonder dat het nodig is de hele dataset te downloaden (zoals gebruikelijk als een dataset van een archiefdienst als DANS of Figshare gedownload wordt).

Vaste dienst van de Bibliotheek

De technologie zelf wordt onderhouden door de Bibliotheek. Deze is ook schaalbaar en betaalbaar zodat de Bibliotheek duurzame toegang kan garanderen. We hebben onze eigen catalogus al beschikbaar gemaakt als Linked Data. Dezelfde SPARQL-zoekopdracht toont daarmee ook bibliotheekexemplaren van 'A Midsummernight's Dream' en daarnaast relevante academische studies over het stuk van Shakespeare.

De Bibliotheek leert via dit project veel over de benodigde (meta) data kwaliteit en hoe deze te verbeteren. Daarnaast onderzoekt de bibliotheek of de Linked Open Data voorziening een permanente bibliotheekdienst kan zijn, waar ook vele andere datasets aan toegevoegd kunnen worden.

Zolang de bijdragers het vocabulaire van schema.org gebruiken, zullen alle datasets op dezelfde manier FAIR zijn - een geweldige bron voor onderzoekers waar dan ook.

Meer informatie

Voor vragen of meer informatie over dit project, kun je contact opnemen met Max Haring, Hoofd Onderwijs- en Onderzoeksondersteuning, Bibliotheek UvA/HvA.

FAIR (vindbaar, toegankelijk, interoperabel, herbruikbaar)

De vindbaarheid wordt gewaarborgd door alle items een persistente identifier te geven. Bijvoorbeeld: de naam 'Shakespeare' wordt geassocieerd met het toneelstuk 'Romeo en Julia' via het predicaat 'auteur': Shakespeare schreef 'Romeo en Julia'.

Om interoperabiliteit te garanderen hebben wij een vocabulaire gebruikt van een internationale open standaard op schema.org - dit betekent dat onze dataset kan worden verbonden aan alle andere gekoppelde datasets die op dezelfde open standaarden zijn gebaseerd.

De resulterende dataset is op verschillende manieren toegankelijk: mensen kunnen de website gebruiken, machines hebben toegang via een API. En nog interessanter: met SPARQL zoekacties is het mogelijk om in alle gekoppelde datasets tegelijk te zoeken, waardoor de dataset herbruikbaar is voor vele soorten onderzoek.

Koploper met pilot Linked Open Data van de Bibliotheek en CREATE

A Midsummernight's Dream

Downloaden overbodig

Vaste dienst van de Bibliotheek

Meer informatie

Cookie Consent