[gnd-ontology] Re: GND-Umlenkungen im Linked Data Service (war: [datenformate] RDF - Fehlende Redirects, Falsche Subjects, Gelöschte Körperschaften)
Christoph, Pascal
christoph at hbz-nrw.de
Mon Okt 19 17:34:33 CEST 2015
Hallo Jana,
Hentschke, Jana wrote on 19.10.2015 16:30 :
[...]
> Anforderungen:
> 1) nachnutzende Systeme sollen Änderungen automatisiert nachvollziehen können
> 2) alle jemals geprägten URIs sollen nutzbar bleiben
> 3) gleichzeitig soll deutlich werden, welches die aktuelle bevorzugte Referenzierung einer GND-Entität ist
>
> Mit der Weiterleitung
>
> Request: http://d-nb.info/gnd/4011882-4
> Response: 301 Moved Permanently
> Location: http://d-nb.info/gnd/2006655-7
>
> soll deutlich gemacht werden, dass sich die bevorzugte Referenzierung der Entität geändert hat.
+1
> Im RDF würden wir dann die zusätzliche Aussage
>
> <http://d-nb.info/gnd/2006655-7>
> owl:sameAs http://d-nb.info/gnd/4011882-4 .
+0 : weiß gar nicht ob das explizit dran muss. Ist natürlich durch Inferenz
implizit so wenn folgendes gemacht wird:
[...]
> Um auch in den GND-Dumpdateien Informationen zu den alten URIs zu liefern, soll zusätzlich die inverse sameAs-Aussage
>
> <http://d-nb.info/gnd/4011882-4>
> owl:sameAs http://d-nb.info/gnd/2006655-7 .
>
> einfügt werden.
also an dieser Stelle ist das sameAs jedenfalls wichtiger, daher hier : +1
[...]
Fein aus meiner Sicht!
pascal
>
> Wir haben uns damit dagegen entschieden, identische Beschreibungen mit unterschiedlichen Subjekten unter den verschiedenen URIs auszuliefern, weil so unseres Erachtens Anforderung 3 nicht genug unterstützt würde (denn langfristig erscheint es vor dem Hintergrund zukünftiger Datenzusammenführungen wünschenswert, möglichst großflächig dieselben URIs zu verwenden).
>
>
> Weitere Gedanken zu dieser Lösung sind willkommen!
>
> Besten Gruß von
> Jana Hentschke
>
>
>
> *** Lesen. Hören. Wissen. Deutsche Nationalbibliothek ***
>
> --
> Jana Hentschke
> Deutsche Nationalbibliothek
> Informationsinfrastruktur
> Adickesallee 1
> D-60322 Frankfurt am Main
> Telefon: +49-69-1525-1773
> Telefax: +49-69-1525-1799
> mailto:j.hentschke at dnb.de
> http://www.dnb.de
>
>
>
>
>
>> -----Ursprüngliche Nachricht-----
>> Von: datenformate-bounces at lists.dnb.de
>> [mailto:datenformate-bounces at lists.dnb.de]
>> Im Auftrag von Thomas Berger
>> Gesendet: Freitag, 2. Oktober 2015 12:39
>> An: Mailingliste Datenformate (frueher mab-list)
>> Betreff: Re: [datenformate] RDF - Fehlende Redirects, Falsche
>> Subjects, Gelöschte Körperschaften
>>
>> -----BEGIN PGP SIGNED MESSAGE-----
>> Hash: SHA1
>>
>> Am 02.10.2015 um 11:31 schrieb Hentschke, Jana:
>>
>> > betreffend die RDF-Auslieferung kann ich berichten, dass auch wir
>> > die
>> kommentarlose Auslieferung der Beschreibung einer anderen Ressource
>> als suboptimal empfinden. Hintergrund dieses derzeitigen Zustandes
>> sind tech nischen Limitierung in der aktuellen Architektur unseres
>> Permalinkresolv ers. Diese lösen sich mit einem Umbau des
>> Permalinkresolvers aber gerade auf und im Anschluss wollen wir die
>> unseres Erachtens semantisch korrek te und intuitivere Kette
>> > "RDF-Anfrage an Umlenksatz" -> 301 -> "Zielsatz" -> 303 -> "RDF
>> > für
>> Zielsatz"
>> > implementieren.
>>
>> Request: http://d-nb.info/gnd/4011882-4
>> Response: 301 Moved Permanently
>> Location: http://d-nb.info/gnd/2006655-7
>>
>> Request: http://d-nb.info/gnd/2006655-7
>> Response: 303 See Other
>> Location: http://d-nb.info/gnd/2006655-7/about/rdf
>>
>> D.h. die BzgA existiert nicht mehr, sondern nur die BzgA, zu der dann
>> Informationen gegeben werden :-?
>>
>> Umgekehrt waere es auch denkbar (303, dann 301)
>>
>> Request: http://d-nb.info/gnd/4011882-4
>> Response: 303 See Other
>> Location: http://d-nb.info/gnd/4011882-4/about/rdf
>>
>> Request: http://d-nb.info/gnd/4011882-4/about/rdf
>> Response: 301 Moved Permanently
>> Location: http://d-nb.info/gnd/2006655-7/about/rdf
>>
>> das wuerde m.E. staerker zum Ausdruck bringen, dass die
>> /Beschreibungen/ zusammengefasst wurden.
>>
>>
>> > Außerdem wäre vielleicht die gleichzeitige Auslieferung einer
>> > zusätzliche Aussage über die ursprünglich angefragte Ressource
>> > hilfreich, für dieses Beispiel:
>> >
>> > <http://d-nb.info/gnd/4011882-4>
>> > owl:sameAs http://d-nb.info/gnd/2006655-7 .
>>
>> Immerhin wuerde damit irgendeine Aussage ueber
>> http://d-nb.info/gnd/4011882-4 getroffen. Normalerweise wuerde ich
>> aber nicht unbedingt erwarten, dass ich unbedingt nun die Aussagen zur
>> anderen URI konsumieren sollte, auch wenn mir die im gleichen Dokument geliefert werden.
>>
>> Ich muss zugeben, dass mir nicht klar ist, wie man die redaktionellen
>> Prozesse bei der Normdatenarbeit in RDF abbilden kann, zu irgendeinem
>> Zeitpunkt in der Vergangenheit waren
>>
>> http://d-nb.info/gnd/4011882-4
>>
>> und
>>
>> http://d-nb.info/gnd/2006655-7
>>
>> getrennte Entitaeten (das war zwar nie "wahr", entsprach aber dem Wissensstand bzw.
>> spiegelte das Schisma in den Normdateien).
>> Jemand drittes haette nun mittels owl:sameAs eine "externe"
>> Identifizierung der beiden Non-Information-Resources ausdruecken koennen.
>>
>> Aktuell wissen wir, dass es sich um dieselbe Entitaet handelt
>> *und* die redaktionelle Zusammenfuehrung hat dazu gefuehrt, dass es
>> eine einheitliche Beschreibung gibt. Man koennte nun
>> also:
>>
>> 1.) leicht modifizierte RDF-Darstellungen exportieren, dabei spiegelt
>> dann das rdf:about-Attribut der RDF:description die jeweils angefragte
>> Nummer, mittels owl:sameAs koennen dann alle Varianten aufgezaehlt
>> werden. Totale Redundanz also, alle Legacy-Identifier werden
>> gleichartig unterstuetzt, ein Vorzugs-Identifier kann mittels
>> gndo-Vokabular ausgedrueckt werden. (HTTP-Redirects von einer Nummer
>> auf die andere waeren dann allerdings kontraproduktiv)
>>
>> 2.) wie bisher nur die RDF-Beschreibung mittels der aktuellen
>> Vorzugs-URI ausgeben, und da sehe ich wie erwaehnt die Schwierigkeit,
>> dass man einerseits weiterhin ausdruecken will, dass die Ressource X
>> durchaus existiert, man aber nicht gewillt ist, weiterhin
>> Beschreibungen dafuer zu geben, sondern eben nur einen Pointer auf die
>> Beschreibungen fuer eine "identische" Ressource Y: Weder OWL noch SKOS
>> scheinen hier angemessene Mechanismen zu haben (ich will ja weder die
>> GND als Ontologie versionieren noch die Entitaeten als Klassen identischer Normsaetze noch abstrakter machen).
>>
>> viele Gruesse
>> Thomas Berger
>>
>>
>
> -----Ursprüngliche Nachricht-----
> Von: datenformate-bounces at lists.dnb.de [mailto:datenformate-bounces at lists.dnb.de] Im Auftrag von Thomas Berger
> Gesendet: Freitag, 2. Oktober 2015 11:40
> An: Mailingliste Datenformate (frueher mab-list)
> Betreff: Re: [datenformate] RDF - Fehlende Redirects, Falsche Subjects, Gelöschte Körperschaften
>
> [...]
>
> Dieser Hinweis ist zwar drin, aber dafuer muss man das URI-Prefix http://d-nb.info/gnd/ mit dem MARC-Prefix "(DE-588)" im String identifizieren, das liegt klarerweise ausserhalb der Verarbeitung von RDF als RDF:
>
>
> <rdf:Description rdf:about="http://d-nb.info/gnd/2006655-7">
> <gndo:gndIdentifier>2006655-7</gndo:gndIdentifier>
> <gndo:oldAuthorityNumber>(DE-588)16269969-4</gndo:oldAuthorityNumber>
> ...
>
> Wuenschenswert waere also noch ein hypothetisches Element
>
> <gndo:gndDeprecatedIdentifier>16269969-4</gndo:gndDeprecatedIdentifier>
>
> und vielleicht sogar
>
> <gndo:gndSupersedes rdf:resource="http://d-nb.info/gnd/16269969-4" />
>
> viele Gruesse
> Thomas Berger
>
>
> -----Ursprüngliche Nachricht-----
> Von: datenformate-bounces at lists.dnb.de [mailto:datenformate-bounces at lists.dnb.de] Im Auftrag von Jan Schnasse
> Gesendet: Freitag, 2. Oktober 2015 10:37
> An: 'Mailingliste Datenformate (frueher mab-list)'
> Betreff: [datenformate] RDF - Fehlende Redirects, Falsche Subjects, Gelöschte Körperschaften
>
> Liebe Kolleginnen und Kollegen,
>
> ich stolpere gerade über eine Körperschaft (z.B. 16269969-4), für die kein RDF mehr über ihren GND-Identifier zu finden ist [1]. M.E. verhält sich die RDF-Schnittstelle hier nicht korrekt. Gehe ich direkt auf den RDF-Endpunkt http://d-nb.info/gnd/16269969-4/about/lds erhalte ich einfach einen Http-200, bekomme aber den Datensatz zur GND-ID
> 2006655-7 ausgeliefert. Dies finde ich kontraintuitiv, da ich keinen Hinweis erhalte, was mit dem eigentlich angefragten Datensatz passiert ist. Wurde er gelöscht? Warum?
>
> [...]
>
> Hier hat es wohl eine Umstrukturierung in der Institution gegeben, aber warum findet man nun keine Daten mehr zu der einst existierenden
> 4011882-4 ? Hintergrund: In unserem Schriftenserver wurden Publikationen zur 4011882-4 zugeordnet.
>
> Viele Grüße
> Jan Schnasse (hbz)
>
>
> [1] Im Katalog bekomme ich ein Redirect (303 --> 302 --> 200) und lande dann bei http://d-nb.info/gnd/2006655-7 . So weit so gut.
>
> --
> Jan Schnasse
> Kendenicher Str. 82, 50969 Köln
> Tel.: 016096241961
> PGP: 0xFD586C6F3D425171
> _______________________________________________
> datenformate mailing list
> datenformate at lists.dnb.de
> http://lists.dnb.de/mailman/listinfo/datenformate
>
>
>
> _______________________________________________
> datenformate mailing list
> datenformate at lists.dnb.de
> http://lists.dnb.de/mailman/listinfo/datenformate
>