12 januari 2023
Het pilotproject bestaat uit het als Linked Open Data beschikbaar stellen van drie bestaande datasets die voortkomen uit onderzoek naar culturele programma’s in Amsterdam door CREATE (Mediastudies UvA).
Samen met het UvA CREATE Lab hebben onze ICT- en metadataspecialisten een mooi project gerealiseerd. Deze nieuwe manier om digitale onderzoeksdata te ontsluiten is een goed voorbeeld van samenwerking tussen onderzoekers en de Bibliotheek en hoe deze bijdraagt aan wetenschap en onderwijs.Max Haring, hoofd Onderwijs en Onderzoek van de Bibliotheek
Een waardevolle erkenning is dat de pilot werd genomineerd voor de Dutch Data Prize 2022, een Nederlandse Dataprijs die om de twee jaar wordt uitgereikt aan een individu of een team dat onderzoeksdata FAIR maakt (Findable, Accessible, Interoperable, Reusable).
1 Cinema Context is een online encyclopedie van de film(cultuur) in Nederland vanaf 1896. Het is een database met historische én hedendaagse filmtheaters in Nederland, en de meer dan 100.000 filmvertoningen sinds die periode. Je krijgt hiermee inzicht in het DNA van de Nederlandse film- en bioscoopcultuur en een deel van het culturele leven van Nederland.
De Linked Data van Cinema Context zijn tot stand gekomen met behulp van een subsidie van KNAW DANS. Hoe de data zijn gemodelleerd en wat je vervolgens met de data kunt (via voorbeeldquery's) is te vinden op https://uvacreate.gitlab.io/cinema-context/cinema-context-rdf/.
2 Onstage bevat alle voorstellingen, inkomsten en culturele programma's in de Amsterdamse openbare schouwburg in de 17e tot de 18e eeuw. Hierin vind je van alle theaterprogramma’s, de opgevoerde stukken per dag, namen van acteurs en vertalers tot aan zelfs de inkomsten door de tijd heen.
De Linked Data van Onstage en Ecartico zijn geïntegreerd in de websites van de twee datasets. Beide datasets zijn verder uitgebreid en doorontwikkeld door de UvA in het Golden Agents project.
3 Ecartico is een database met biografische informatie van mensen die betrokken waren bij de culturele sector in Amsterdam in de 16e-18e eeuw: kunstenaars, schilders, acteurs, zaaleigenaren, etc. Je kunt meer dan alleen zoeken en bladeren naar gegevens over personen of selecties maken van bepaalde soorten gegevens. Met Ecartico kun je ook gegevens over culturele ondernemers en hun 'milieus' visualiseren en analyseren.
Alle drie de databases zijn afzonderlijk te gebruiken, maar in deze pilot brengen we alle data samen en stellen deze open voor bredere analyse.
Zo zie je dat 'A Midsummernight's Dream' in een Nederlandse bewerking niet alleen een toneelstuk is dat in de 17e eeuw minstens eenmaal per jaar in het openbare theater werd opgevoerd, maar ook dat het de titel is van een film uit 1935 die verschillende keren is vertoond in Nederlandse steden. Ook kun je namen vinden van de 17e-eeuwse vertalers en de sociale netwerken die deze voorstellingen mogelijk maakten. Op het moment dat deze datasets aan elkaar worden gekoppeld, ontstaan nieuwe mogelijkheden voor onderzoek.
Deze drie gekoppelde open datasets hebben duidelijke voordelen ten opzichte van hun afzonderlijke dataset-iteraties: geen databankbestanden meer downloaden.
Het is bijvoorbeeld mogelijk om naar een enkele persoon in een dataset te verwijzen en zijn of haar data te gebruiken zonder dat het nodig is de hele dataset te downloaden (zoals gebruikelijk als een dataset van een archiefdienst als DANS of Figshare gedownload wordt).
De technologie zelf wordt onderhouden door de Bibliotheek. Deze is ook schaalbaar en betaalbaar zodat de Bibliotheek duurzame toegang kan garanderen. We hebben onze eigen catalogus al beschikbaar gemaakt als Linked Data. Dezelfde SPARQL-zoekopdracht toont daarmee ook bibliotheekexemplaren van 'A Midsummernight's Dream' en daarnaast relevante academische studies over het stuk van Shakespeare.
De Bibliotheek leert via dit project veel over de benodigde (meta) data kwaliteit en hoe deze te verbeteren. Daarnaast onderzoekt de bibliotheek of de Linked Open Data voorziening een permanente bibliotheekdienst kan zijn, waar ook vele andere datasets aan toegevoegd kunnen worden.
Zolang de bijdragers het vocabulaire van schema.org gebruiken, zullen alle datasets op dezelfde manier FAIR zijn - een geweldige bron voor onderzoekers waar dan ook.
Voor vragen of meer informatie over dit project, kun je contact opnemen met Max Haring, Hoofd Onderwijs- en Onderzoeksondersteuning, Bibliotheek UvA/HvA.