Externe bronnen - Open Cultuur Data

Report
EXTERNE
DATABRONNEN
Alina Saenko
- WELKE EXTERNE DATABRONNEN
ZIJN ER? WELKE ZIJN BRUIKBAAR?
- WELKE NOTATIESTANDAARDEN ZIJN
ER EN HOE PAS JE ZE TOE?
WELKE EXTERNE DATABRONNEN
ZIJN ER?
 wat wil je identificeren?
 welke contextuele info biedt de externe databron?
 hoe hoog is de kwaliteit?
Persoon: VIAF, RKDartist, ULAN, Freebase, ODIS, ISNI, BALAT…
Instelling: Wikidata, ISIL…
Plaats: Geonames, TGN, CRAB…
Concepten: AAT-Ned, Van Dale, UDC, Iconclass, GTAA, Wordnet, LCSH
Kunstwerk: CONA
…
VIAF
VIAF
 Beheerorganisatie:
- OCLC
 Inhoudelijk:
- Personen en instellingen, bibliografie, naamsvarianten
- data nationale bibliotheken en bibliografische centra uit verschillende landen
- ook ISNI, ULAN, VLACC, Wiki
 Toegankelijkheid:
- rechtstreeks via een webbrowser
- export downloaden (RDF/XML, MARC-XML, JSON)
- API webservice (opensearch, autosuggest, SRU)
 Persistentie: http://viaf.org/viaf/116687796
 Licentie: Open Data Commons Attribution Licentie ODC BY 1.0.
 Aanvullingen: als een volledige contributor
VIAF
Voordelen
Nadelen
- internationaal bereik
- is eigenlijk een bibliotheekindex
(auteurs)
- heeft een groot aantal andere
autoriteiten al in zich opgenomen
- toegankelijk in verschillende
formaten, en zowel via API als
download
- open data
- niet gemakkelijk om een nieuwe
term toe te voegen, toevoegen kan
enkel via grote organisatie
- in de praktijk: enkele beperkingen
tijdens het gebruik van API (beperkt
aantal vragen, vooral voor grote
opdrachten)
- lokaal bereik: vermoedelijk weinig
resultaat voor lokaal bekende
kunstenaars
GEONAMES
GEONAMES
 Beheerorganisatie: Crowdsourcing project, Technische GeoNames Team en
vertegenwoordigers in landen
 Inhoudelijk:
- gebaseerd op bestaande open data uit nationale geografische agentschappen
- data over plaatsen, topografische data, officiële namen en informele benamingen,
statistiek, postcodes, historische namen (work-in-progress)
- in verschillende talen
 Toegankelijkheid:
- rechtstreeks via een webbrowser
- export mogelijk (RDF/XML, KML, JSON, CSV, TXT)
- API webservice (fulltext, op postcodes, op plaatsnaam, complex)
 Persistentie: http://www.geonames.org/2802361
 Licentie: Creative Commons Attribution 3.0 License
 Aanvullingen: registratie en zelf aanpassingen uitvoeren
AAT
AAT
 Beheerorganisatie:
- Getty Research Institute
- Bureau AAT binnen RKD
 Inhoudelijk:
- 30.000 unieke cultuurhistorische begrippen
- materialen, objecten, stijlen, fysieke kenmerken…
 Toegankelijkheid:
- rechtstreeks via een webbrowser
- export mogelijk (SKOS of XML)
- AAT-Ned API webservice, Getty AAT webservice (zoeken op term en in scope
notes, SKOS of XML)
 Persistentie: http://vocab.getty.edu/aat/300260338
 Licentie: Open Data Commons Attribution Licentie ODC BY 1.0.
 Aanvullingen: procedure bestaat…
AAT
Voordelen
Nadelen
- standaard wordt actief en
internationaal beheerd
- het toevoegen van nieuwe
termen is in de praktijk nog
niet heel goed uitgewerkt, het
proces verloopt heel
moeizaam
- grote hoeveelheid
Nederlandstalige termen
- toegankelijk als een
webservice
WELKE NOTATIESTANDAARDEN ZIJN
ER EN HOE PAS JE ZE TOE?
ISO 8601 – een standaard voor het noteren van een datum
Algemene principes:
- van groot naar klein: jaar - maand - dag - uur - minuut - seconde
- vaste aantal mogelijke karakters (YYYY-MM-DDThh:mm:ss)
- gebruik een streepje (-) voor verdeling datum,
- gebruik een dubbelpunt (:) voor verdeling tijd
- elementen die niet relevant zijn voor een datum hoeven niet volledig uitgeschreven te
worden (vb. ‘2004-05’ betekent mei 2004. Het zal nooit als de periode van 2004 tot 2005
worden begrepen)
- ook mogelijk om periodes aan te geven: tussen begin en eind datum dient er een schuine
streep (/) worden geplaatst.
ISO 8601
Voordelen
Nadelen
- duidelijk en machineleesbaar,
wat doorzoekbaarheid
verhoogt
- nood aan interne afspraken
i.v.m. de interpretatie van
precisie
- wijdverspreide webstandaard
voor dateringen
- de terminologie aanvaardt
enkel precisie tijdsperiodes.
Open tijdsbepalingen zoals
een terminus post/ante quem
kunnen niet gecodeerd
worden

similar documents