AW: [dini-ag-kim-lld] Linked Data Service der DeutschenNationalbibliothek: Daten stehen zum Download bereit

Wed Jun 20 11:37:46 CEST 2012

Hallo,

zu Beginn hatten wir auch vor ein prefName und ein altName Attribut für alle Entitäten zu verwenden. Grund warum wir davon abgekommen sind, ist das Vocabulary Alignment. In den meisten Ontologien wird hier differenziert (siehe bspw. RDA). Somit war es auch für uns notwendig Properties mit genau spezifizierter Domain einzuführen, um diese mit Entsprechungen in anderen Ontologien versehen zu können. Gleiches gilt u.a. für Vorgänger und Nachfolger. 

Adrian du hast es ja schon richtig erkannt, alle bevorzugten und varianten Namensproperties haben ja jeweils eine gemeinsame Super-Property, sprich diese gibt ja letztendlich die durch euch gewünschte Info. An der Stelle würde ich noch gar nicht unbedingt von Reasoning sprechen wollen, aber genau so sollte LD ja funktionieren - nutze mit einander in Verbindung stehende Informationen...ansonsten könnten wir ja bei klassischen Formaten bleiben. 

Der Aspekt den Joachim noch ins Spiel gebracht hat, ist ebenfalls nicht unwesentlich. Wenn man nur mit prefLabel arbeitet ist man zusätzlich verpflichtet für die Eineindeutigkeit dieser zu sorgen, was einen erheblichen Mehraufwand bei der Konvertierung mit sich bringen würde. 

Grüße, alex

PS: sorry für die verspätete Antwort, aber der Vorort-Support hat sich ja auf das EM-Vorrundenergebnis gut ausgewirkt :-) 

> -----Ursprüngliche Nachricht-----
> Von: dini-ag-kim-lld-bounces at lists.d-nb.de [mailto:dini-ag-kim-lld-
> bounces at lists.d-nb.de] Im Auftrag von Neubert Joachim
> Gesendet: Montag, 11. Juni 2012 14:06
> An: Informationsaustausch der DINI AG KIM Linked Library Data Gruppe
> Betreff: RE: [dini-ag-kim-lld] Linked Data Service der
> DeutschenNationalbibliothek: Daten stehen zum Download bereit
> 
> Hallo allerseits,
> 
> das von Adrian aufgezeigte Problem eines fehlenden einheitlichen Labels
> ließe sich lösen durch ein einheitliches gnd:prefLabel (als Äquivalent
> zu skos:prefLabel in der GND-Ontology), das für alle echten Entitäten
> *zusätzlich* vergeben wird. Der große Vorteil skos:prefLabel ist, dass
> es 1. nur einmal auftreten darf (pro Sprache), und 2. weitestgehend
> unique sein soll. (Da Uniqueness nur schwer zu garantieren ist, ist
> diese weichere Formulierung in der Praxis sehr hilfreich).
> 
> Gegenüber Adrians Vorschlag, einfach die vorhandenen Properties anders
> zu benennen (gnd:preferredName für gnd:preferredNameForThePerson,
> gnd:preferredNameForTheSubjectHeading etc.) käme die (weitestgehende)
> Eindeutigkeit hinzu, was vor allem bei Personennamen auch im
> Anwendungskontext sinnvoll ist. Zudem blieben die ursprünglichen
> Properties erhalten, um z.B. den eigentlichen Personennamen weiterhin
> zur Verfügung zu haben.
> 
> Insbesondere für Personennamen müsste so ein gnd:prefLabel konstruiert
> werden (durch Zufügen von Lebensdaten, Affiliation etc.). Wir machen
> das bereits für unseren econ_person Webservice
> (http://zbw.eu/beta/econ-ws, z.B. http://zbw.eu/beta/econ-
> ws/suggest2?dataset=econ_pers&query=siebert), was aber einen durchaus
> aufwendigen und komplexen zusätzlichen Vorverarbeitsschritt erfordert.
> Für Anwendungen wie die von Adrian skizzierte wäre es äußerst
> hilfreich, wenn solche Labels von der Quelle geliefert würden und
> idealerweise auch Teil der Normdatenpflege würde. So könnten
> automatisch konstruierte und z.T. sehr umfangreiche Labels auf kurze
> und aussagekräftige reduziert werden. Ein Beispiel, wie so etwas
> aussehen kann, findet sich unter http://www.munzinger.de.
> 
> Schöne Grüße, Joachim
> 
> > -----Original Message-----
> > From: dini-ag-kim-lld-bounces at lists.d-nb.de
> > [mailto:dini-ag-kim-lld-bounces at lists.d-nb.de] On Behalf Of
> > Adrian Pohl
> > Sent: Monday, June 11, 2012 12:52 PM
> > To: 'dini-ag-kim-lld at lists.d-nb.de'
> > Subject: Re: [dini-ag-kim-lld] Linked Data Service der
> > DeutschenNationalbibliothek: Daten stehen zum Download bereit
> >
> > Hallo,
> >
> > wir haben den neuen GND-LOD-Dump mal in unseren Triple Store
> > eingespielt. Hintergrund: Wir würden gerne auf der
> > lobid.org-Seite die Labels der Schlagwörter entsprechend
> > anzeigen und nicht nur die entsprechenden URIs. Leider ist
> > dies mit der GND-Ontologie nicht so einfach möglich, wenn man
> > nicht gerade zusätzliches Inferencing einsetzt. Der Grund:
> > Nicht nur werden "Authority Resources" in der Ontologie in
> > verschiedene Unterklassen und Unterunterklassen unterteilt,
> > was natürlich sehr sinnvoll ist, z.B. gnd:SubjectHeading,
> > gnd:SubjectHeadingSensoStricto, gnd:Person,
> > gnd:UndifferentiatedPerson, gnd:DifferentiatedPerson,
> > gnd:CorporateBodyOrAdministrativeUnit,
> > gnd:PlaceOrGeographicName (BTW, müsste das nicht
> > PlaceOrGeographicEntity heißen?). Auch gibt es für diese
> > verschiedenen Klassen verschiedene Properties zur Angabe
> > ihres bevorzugten menschenlesbaren Etiketts, z.B.
> > gnd:preferredNameForTheSubjectHeading,
> > gnd:preferredNameForThePerson,
> > gnd:preferredNameForThePlaceOrGeographicName [sic].
> >
> > Meine Frage: Reicht es nicht aus, die Entitäten zu
> > klassifizieren und das bevorzugte menschenlesbare Etikett
> > jeweils unter einer einzigen Property gnd:preferredName
> > anzugeben? Die Art des Labels lässt sich ja dann leicht
> > herausfinden, weil es eben das Label für die einer bestimmten
> > Klasse zugehörigen Entität ist. Ich wüsste gerne, warum ihr
> > euch für diese (scheinbare?) Redundanz entschieden habt.
> > Bisher sehe ich darin keinen Nutzen für die Arbeit mit den
> > Daten, ganz im Gegenteil.
> >
> > Vielen Dank im Voraus.
> >
> > Ciao
> > Adrian
> >
> > >>> On 5.6.2012 at 14:22, "Hauser, Julia" <J.Hauser at dnb.de> wrote:
> > > ***Mehrfachempfang bitte ich zu entschuldigen.***
> > >
> > > Liebe Kolleginnen und Kollegen,
> > >
> > > die Daten des Linked Data Services stehen nun als Dumps zum
> Download
> > bereit
> > > (siehe [1]). Sie liegen in der Serialisierung RDF/Turtle vor.
> > >
> > > Es stehen zwei ZIP-Dateien zur Verfügung:
> > > -       9493987  Datensätze der Gemeinsamen Normdatei (GND): je
> eine
> > Datei
> > > für die acht GND-Satzarten (609347703 Bytes)
> > > -       11366977  Titeldatensätze: eine Datei (1085889037 Bytes)
> > >
> > > Es ist geplant, die Dumps in regelmäßigen Abständen zu
> > aktualisieren.
> > Wir
> > > informieren über die Mailinglisten, sobald die initialen Dumps
> durch
> > die
> > > periodischen Updates ersetzt werden.
> > >
> > > Anmerkungen und Fragen können wie bisher unter [2] angebracht
> > werden.
> > >
> > > Mit besten Grüßen,
> > > Julia Hauser
> > >
> > > [1] http://www.dnb.de/datendienste/linkedData
> > > [2] https://wiki.dnb.de/display/LDS/
> > >
> > >
> > > ***Lesen. Hören. Wissen. 100 Jahre Deutsche Nationalbibliothek***
> > >
> > >       --
> > > Julia Hauser
> > > Deutsche Nationalbibliothek
> > > Informationstechnik
> > > Adickesallee 1
> > > D-60322 Frankfurt am Main
> > > Telefon: +49-69-1525-1784
> > > Telefax: +49-69-1525-1799
> > > mailto:j.hauser at dnb.de
> > > http://www.dnb.de<http://www.dnb.de/>
> >
> > _______________________________________________
> > dini-ag-kim-lld mailing list
> > dini-ag-kim-lld at lists.d-nb.de
> > http://lists.d-nb.de/mailman/listinfo/dini-ag-kim-lld
> >
> _______________________________________________
> dini-ag-kim-lld mailing list
> dini-ag-kim-lld at lists.d-nb.de
> http://lists.d-nb.de/mailman/listinfo/dini-ag-kim-lld