[gnd-ontology] Zwei Probleme mit GND-Daten
Adrian Pohl
pohl at hbz-nrw.de
Mo Jul 17 14:31:10 CEST 2017
Liebe Kolleginnen und Kollegen,
wir haben vor einigen Tagen damit angefangen, an einer neuen Version der
lobid-GND-API zu arbeiten. Dabei sind uns zwei Probleme mit den Daten
aufgefallen.
Das erste Problem wurde bereits vor einem Jahr von Sorin Gheorghiu
gemeldet [1]. Auch jetzt weisen noch mehrere tausend Einträge
Widersrpüche zwischen ihrem Typ und den genutzten properties auf, z.B.
gibt es 2423 Einträge vom Typ "ConferenceOrEvent" mit der Property
"preferredNameForTheCorporateBody" (anstatt korrekt
"preferredNameForTheConferenceOrEvent"), siehe [2] in unserem
Test-System. Gibt es einen Plan für die Korrektur der Einträge?
Zweitens ist uns bei der Indexierung aufgefallen, dass die Property
gndo:academicDegree sowohl mit einer URI (z.B. [3]) als auch mit Strings
(z.B. [4]) benutzt wird. Für das Release 01/2014 wurde angekündigt, dass
die Property nur noch als datatype property benutzt werden würde. [5]
Dies ist auch in den meisten Fällen so, aber nicht im gesamten Datenset.
Von den ca 400k Einträgen mit der Property gndo:academicDegree haben gut
9000 Einträge eine URI als Objekt der Property, siehe [6].
Viele Grüße
Adrian
[1] http://lists.dnb.de/pipermail/gnd-ontology/2016-July/000083.html
[2]
http://test.lobid.org/authorities/search?q=type:ConferenceOrEvent+AND+preferredNameForTheCorporateBody:*&size=50
[3] http://d-nb.info/gnd/100095089/about/lds
[4] http://d-nb.info/gnd/100072488/about/lds
[5]
http://www.dnb.de/SharedDocs/Downloads/EN/DNB/service/rundschreiben20131029AenderungRdfxmlEn.pdf?__blob=publicationFile
[6] http://test.lobid.org/authorities/search?q=academicDegree:http*&size=10
Mehr Informationen über die Mailingliste Gnd-ontology