Voor de beste ervaring schakelt u JavaScript in en gebruikt u een moderne browser!
Je gebruikt een niet-ondersteunde browser. Deze site kan er anders uitzien dan je verwacht.

Open data

Open data zijn data die vrij toegankelijk zijn, zonder abonnement of betaalmuur. Wie open data publiceert, geeft via een licentie aan of en hoe de data door anderen mogen worden hergebruikt.

Openheid van onderzoeksdata is het uitgangspunt van de wereldwijde Open Science-beweging. Steeds meer wetenschappers realiseren zich dat de resultaten van publiek gefinancierd onderzoek, inclusief de onderliggende data, voor een breed publiek ter beschikking moeten komen om transparantie, hergebruik en interdisciplinariteit te bevorderen.

Veel overheidsorganisaties in binnen- en buitenland publiceren een deel van hun data open, omwille van de transparantie, hergebruik en verantwoording.

Ook in de erfgoedsector zijn sinds 2010 initiatieven om collectiedata open beschikbaar te stellen voor het publiek. Dat geldt ook voor de Bibliotheek.

Linked open data (LOD)

Er zijn verschillende manieren om gestructureerde data vast te leggen. De meest voorkomende manier is via tabellen. Daarnaast is linked data de afgelopen decennia in zwang geraakt. Vastlegging als linked data zorgt dat de data verbonden is en via semantische zoekacties bevraagd kan worden. Omdat linked data voortbouwt op standaard webtechnologie zoals HTTP, RDF en URI’s, is het automatisch ook machine-leesbaar. Een ander sterk punt van linked data is dat de betekenis in de data zelf besloten ligt, terwijl tabulaire data afgeleide informatie bevat die machines niet vanzelfsprekend als zodanig kunnen herkennen en interpreteren.

De LOD-beweging groeit snel, waardoor ook de mogelijkheden om bestaande informatie te koppelen en verrijken toenemen en de zoekervaring steeds beter wordt. Een voorbeeld van een enorme LOD-verzameling is Wikidata.

FAIR-principes

Linked Open Data sluit naadloos aan bij de FAIR-principes die wij als universiteitsbibliotheek hebben omarmd:

  • Gegevens worden vindbaar door het gebruik van unieke identifiers (URI's) voor elke bron, die gemakkelijk kunnen worden ontdekt door zoekmachines en andere instrumenten.
  • Gegevens worden toegankelijk door open en gestandaardiseerde interfaces te bieden (bv. Sparql voor de bevraging van gegevens).
  • Gegevens worden interoperabel door het gebruik van gestandaardiseerde ontologieën en vocabulaires die het mogelijk maken gegevens gemakkelijk te integreren met andere datasets.
  • Gegevens worden herbruikbaar door gedetailleerde en machineleesbare metadata te verstrekken die de inhoud, structuur en context van de gegevens beschrijven.

LOD gebruiken

LOD-toepassingen hebben meestal een zoekfunctie, die werkt met behulp van de Sparql-zoektaal. Met die taal kun je in één of meer datasets tegelijk zoeken. Om linked data sets te gebruiken voor onderzoek zul je deze zoektaal eerst moeten leren. Online zijn er veel tutorials beschikbaar. Kijk bijvoorbeeld eens bij data.world of bij The Carpentries.

Je kunt linked data via een continue stroom beschikbaar stellen. Ze zijn dan benaderbaar via een API. Dit is handig als de data aan voortdurende verandering onderhevig zijn. Ook kun je een linked open dataset in zijn geheel downloaden voor verdere analyse.

Linked Open Data is een basis voor geautomatiseerd zoeken en kunstmatige intelligentie. De virtuele vraagbaken Siri (Apple), Alexa (Amazon) en Google Assistant halen er hun kennis uit.

Open collectiedata

De data bij de UvA-collecties (inclusief het Allard Pierson) zijn beschikbaar in deze formats en via diverse publicatiekanalen zoals downloads, OAI harvesting, API's, Linked Data Endpoints en andere tools, met deze licenties

Daarnaast zijn via CatalogusPlus individuele records in diverse formats beschikbaar (ruwe MARC, verschillende citation en reference manager/RIS formats).

Het toegankelijk maken van metadata als linked open data is een arbeidsintensieve klus die we in stappen realiseren.

Open data, aangeleverd door UvA-onderzoekers

In 2022 heeft de Bibliotheek samen met het UvA CREATE Lab drie bestaande datasets als Linked Open Data beschikbaar gesteld: Cinema Context, Onstage en Ecartico.

  • Cinema Context is een online encyclopedie van de film(cultuur) in Nederland vanaf 1896. Het is een database met historische én hedendaagse filmtheaters in Nederland, en de meer dan 100.000 filmvertoningen sinds die periode. Je krijgt hiermee inzicht in het DNA van de Nederlandse film- en bioscoopcultuur en een deel van het culturele leven van Nederland.
  • Hoe de data zijn gemodelleerd en wat je vervolgens met de data kunt (via voorbeeldquery's) is te vinden op https://uvacreate.gitlab.io/cinema-context/cinema-context-rdf/
  • Onstage bevat alle voorstellingen, inkomsten en culturele programma's in de Amsterdamse openbare schouwburg in de 17e tot de 18e eeuw. Hierin vind je van alle theaterprogramma’s, de opgevoerde stukken per dag, namen van acteurs en vertalers tot aan zelfs de inkomsten door de tijd heen.
  • Ecartico is een database met biografische informatie van mensen die betrokken waren bij de culturele sector in Amsterdam in de 16e-18e eeuw: kunstenaars, schilders, acteurs, zaaleigenaren, etc. Je kunt meer dan alleen zoeken en bladeren naar gegevens over personen of selecties maken van bepaalde soorten gegevens. Met Ecartico kun je ook gegevens over culturele ondernemers en hun 'milieus' visualiseren en analyseren.

Op deze data is niet één generieke licentie van toepassing. Welke licentie van toepassing is vind je bij de betreffende dataset.

Contact

Voor vragen en suggesties, neem contact op met Hadewijch Dekker.