[gnd-ontology] Zwei Probleme mit GND-Daten

Adrian Pohl pohl at hbz-nrw.de
Mo Jul 17 14:31:10 CEST 2017


Liebe Kolleginnen und Kollegen,

wir haben vor einigen Tagen damit angefangen, an einer neuen Version der 
lobid-GND-API zu arbeiten. Dabei sind uns zwei Probleme mit den Daten 
aufgefallen.

Das erste Problem wurde bereits vor einem Jahr von Sorin Gheorghiu 
gemeldet [1]. Auch jetzt weisen noch mehrere tausend Einträge 
Widersrpüche zwischen ihrem Typ und den genutzten properties auf, z.B. 
gibt es 2423 Einträge vom Typ "ConferenceOrEvent" mit der Property 
"preferredNameForTheCorporateBody" (anstatt korrekt 
"preferredNameForTheConferenceOrEvent"), siehe [2] in unserem 
Test-System. Gibt es einen Plan für die Korrektur der Einträge?

Zweitens ist uns bei der Indexierung aufgefallen, dass die Property 
gndo:academicDegree sowohl mit einer URI (z.B. [3]) als auch mit Strings 
(z.B. [4]) benutzt wird. Für das Release 01/2014 wurde angekündigt, dass 
die Property nur noch als datatype property benutzt werden würde. [5] 
Dies ist auch in den meisten Fällen so, aber nicht im gesamten Datenset. 
Von den ca 400k Einträgen mit der Property gndo:academicDegree haben gut 
9000 Einträge eine URI als Objekt der Property, siehe [6].

Viele Grüße
Adrian

[1] http://lists.dnb.de/pipermail/gnd-ontology/2016-July/000083.html
[2] 
http://test.lobid.org/authorities/search?q=type:ConferenceOrEvent+AND+preferredNameForTheCorporateBody:*&size=50
[3] http://d-nb.info/gnd/100095089/about/lds
[4] http://d-nb.info/gnd/100072488/about/lds
[5] 
http://www.dnb.de/SharedDocs/Downloads/EN/DNB/service/rundschreiben20131029AenderungRdfxmlEn.pdf?__blob=publicationFile
[6] http://test.lobid.org/authorities/search?q=academicDegree:http*&size=10


Mehr Informationen über die Mailingliste Gnd-ontology