[dini-ag-kim-lld] Linked Data Service der DeutschenNationalbibliothek: Daten stehen zum Download bereit

Neubert Joachim J.Neubert at zbw.eu
Mon Jun 11 14:05:49 CEST 2012


Hallo allerseits,

das von Adrian aufgezeigte Problem eines fehlenden einheitlichen Labels ließe sich lösen durch ein einheitliches gnd:prefLabel (als Äquivalent zu skos:prefLabel in der GND-Ontology), das für alle echten Entitäten *zusätzlich* vergeben wird. Der große Vorteil skos:prefLabel ist, dass es 1. nur einmal auftreten darf (pro Sprache), und 2. weitestgehend unique sein soll. (Da Uniqueness nur schwer zu garantieren ist, ist diese weichere Formulierung in der Praxis sehr hilfreich). 

Gegenüber Adrians Vorschlag, einfach die vorhandenen Properties anders zu benennen (gnd:preferredName für gnd:preferredNameForThePerson, gnd:preferredNameForTheSubjectHeading etc.) käme die (weitestgehende) Eindeutigkeit hinzu, was vor allem bei Personennamen auch im Anwendungskontext sinnvoll ist. Zudem blieben die ursprünglichen Properties erhalten, um z.B. den eigentlichen Personennamen weiterhin zur Verfügung zu haben.

Insbesondere für Personennamen müsste so ein gnd:prefLabel konstruiert werden (durch Zufügen von Lebensdaten, Affiliation etc.). Wir machen das bereits für unseren econ_person Webservice (http://zbw.eu/beta/econ-ws, z.B. http://zbw.eu/beta/econ-ws/suggest2?dataset=econ_pers&query=siebert), was aber einen durchaus aufwendigen und komplexen zusätzlichen Vorverarbeitsschritt erfordert. Für Anwendungen wie die von Adrian skizzierte wäre es äußerst hilfreich, wenn solche Labels von der Quelle geliefert würden und idealerweise auch Teil der Normdatenpflege würde. So könnten automatisch konstruierte und z.T. sehr umfangreiche Labels auf kurze und aussagekräftige reduziert werden. Ein Beispiel, wie so etwas aussehen kann, findet sich unter http://www.munzinger.de.

Schöne Grüße, Joachim

> -----Original Message-----
> From: dini-ag-kim-lld-bounces at lists.d-nb.de 
> [mailto:dini-ag-kim-lld-bounces at lists.d-nb.de] On Behalf Of 
> Adrian Pohl
> Sent: Monday, June 11, 2012 12:52 PM
> To: 'dini-ag-kim-lld at lists.d-nb.de'
> Subject: Re: [dini-ag-kim-lld] Linked Data Service der 
> DeutschenNationalbibliothek: Daten stehen zum Download bereit
> 
> Hallo,
> 
> wir haben den neuen GND-LOD-Dump mal in unseren Triple Store 
> eingespielt. Hintergrund: Wir würden gerne auf der 
> lobid.org-Seite die Labels der Schlagwörter entsprechend 
> anzeigen und nicht nur die entsprechenden URIs. Leider ist 
> dies mit der GND-Ontologie nicht so einfach möglich, wenn man 
> nicht gerade zusätzliches Inferencing einsetzt. Der Grund: 
> Nicht nur werden "Authority Resources" in der Ontologie in 
> verschiedene Unterklassen und Unterunterklassen unterteilt, 
> was natürlich sehr sinnvoll ist, z.B. gnd:SubjectHeading, 
> gnd:SubjectHeadingSensoStricto, gnd:Person, 
> gnd:UndifferentiatedPerson, gnd:DifferentiatedPerson, 
> gnd:CorporateBodyOrAdministrativeUnit,
> gnd:PlaceOrGeographicName (BTW, müsste das nicht 
> PlaceOrGeographicEntity heißen?). Auch gibt es für diese 
> verschiedenen Klassen verschiedene Properties zur Angabe 
> ihres bevorzugten menschenlesbaren Etiketts, z.B.
> gnd:preferredNameForTheSubjectHeading, 
> gnd:preferredNameForThePerson, 
> gnd:preferredNameForThePlaceOrGeographicName [sic].
> 
> Meine Frage: Reicht es nicht aus, die Entitäten zu 
> klassifizieren und das bevorzugte menschenlesbare Etikett 
> jeweils unter einer einzigen Property gnd:preferredName 
> anzugeben? Die Art des Labels lässt sich ja dann leicht 
> herausfinden, weil es eben das Label für die einer bestimmten 
> Klasse zugehörigen Entität ist. Ich wüsste gerne, warum ihr 
> euch für diese (scheinbare?) Redundanz entschieden habt. 
> Bisher sehe ich darin keinen Nutzen für die Arbeit mit den 
> Daten, ganz im Gegenteil.
> 
> Vielen Dank im Voraus.
> 
> Ciao
> Adrian
> 
> >>> On 5.6.2012 at 14:22, "Hauser, Julia" <J.Hauser at dnb.de> wrote: 
> > ***Mehrfachempfang bitte ich zu entschuldigen.***
> > 
> > Liebe Kolleginnen und Kollegen,
> > 
> > die Daten des Linked Data Services stehen nun als Dumps zum Download
> bereit 
> > (siehe [1]). Sie liegen in der Serialisierung RDF/Turtle vor.
> > 
> > Es stehen zwei ZIP-Dateien zur Verfügung:
> > -       9493987  Datensätze der Gemeinsamen Normdatei (GND): je eine
> Datei 
> > für die acht GND-Satzarten (609347703 Bytes)
> > -       11366977  Titeldatensätze: eine Datei (1085889037 Bytes)
> > 
> > Es ist geplant, die Dumps in regelmäßigen Abständen zu 
> aktualisieren.
> Wir 
> > informieren über die Mailinglisten, sobald die initialen Dumps durch
> die 
> > periodischen Updates ersetzt werden.
> > 
> > Anmerkungen und Fragen können wie bisher unter [2] angebracht
> werden.
> > 
> > Mit besten Grüßen,
> > Julia Hauser
> > 
> > [1] http://www.dnb.de/datendienste/linkedData
> > [2] https://wiki.dnb.de/display/LDS/
> > 
> > 
> > ***Lesen. Hören. Wissen. 100 Jahre Deutsche Nationalbibliothek***
> > 
> >       --
> > Julia Hauser
> > Deutsche Nationalbibliothek
> > Informationstechnik
> > Adickesallee 1
> > D-60322 Frankfurt am Main
> > Telefon: +49-69-1525-1784
> > Telefax: +49-69-1525-1799
> > mailto:j.hauser at dnb.de
> > http://www.dnb.de<http://www.dnb.de/>
> 
> _______________________________________________
> dini-ag-kim-lld mailing list
> dini-ag-kim-lld at lists.d-nb.de
> http://lists.d-nb.de/mailman/listinfo/dini-ag-kim-lld
> 


More information about the dini-ag-kim-lld mailing list