[gnd-ontology] Re: GND-Umlenkungen im Linked Data Service (war: [datenformate] RDF - Fehlende Redirects, Falsche Subjects, Gelöschte Körperschaften)

Christoph, Pascal christoph at hbz-nrw.de
Mon Okt 19 17:34:33 CEST 2015


Hallo Jana,

Hentschke, Jana wrote on 19.10.2015 16:30 :

[...]
> Anforderungen:
> 1) nachnutzende Systeme sollen Änderungen automatisiert nachvollziehen können
> 2) alle jemals geprägten URIs sollen nutzbar bleiben
> 3) gleichzeitig soll deutlich werden, welches die aktuelle bevorzugte Referenzierung einer GND-Entität ist 
> 
> Mit der Weiterleitung
> 
>   Request: http://d-nb.info/gnd/4011882-4
>   Response: 301 Moved Permanently
>   Location: http://d-nb.info/gnd/2006655-7
> 
> soll deutlich gemacht werden, dass sich die bevorzugte Referenzierung der Entität geändert hat.

+1

> Im RDF würden wir dann die zusätzliche Aussage
> 
> <http://d-nb.info/gnd/2006655-7>
>   owl:sameAs http://d-nb.info/gnd/4011882-4 .

+0 : weiß gar nicht ob das explizit dran muss. Ist natürlich durch Inferenz
implizit so wenn folgendes gemacht wird:

[...]

> Um auch in den GND-Dumpdateien Informationen zu den alten URIs zu liefern, soll zusätzlich die inverse sameAs-Aussage
> 
> <http://d-nb.info/gnd/4011882-4>
>   owl:sameAs http://d-nb.info/gnd/2006655-7 .
> 
> einfügt werden.

also an dieser Stelle ist das sameAs jedenfalls wichtiger, daher hier : +1

[...]

Fein aus meiner Sicht!

pascal
> 
> Wir haben uns damit dagegen entschieden, identische Beschreibungen mit unterschiedlichen Subjekten unter den verschiedenen URIs auszuliefern, weil so unseres Erachtens Anforderung 3 nicht genug unterstützt würde (denn langfristig erscheint es vor dem Hintergrund zukünftiger Datenzusammenführungen wünschenswert, möglichst großflächig dieselben URIs zu verwenden).
> 
> 
> Weitere Gedanken zu dieser Lösung sind willkommen!
> 
> Besten Gruß von
> Jana Hentschke
> 
> 
> 
> *** Lesen. Hören. Wissen. Deutsche Nationalbibliothek *** 
>  
> --
> Jana Hentschke
> Deutsche Nationalbibliothek
> Informationsinfrastruktur
> Adickesallee 1
> D-60322 Frankfurt am Main
> Telefon: +49-69-1525-1773
> Telefax: +49-69-1525-1799
> mailto:j.hentschke at dnb.de
> http://www.dnb.de  
> 
> 
> 
> 
> 
>> -----Ursprüngliche Nachricht-----
>> Von: datenformate-bounces at lists.dnb.de 
>> [mailto:datenformate-bounces at lists.dnb.de]
>> Im Auftrag von Thomas Berger
>> Gesendet: Freitag, 2. Oktober 2015 12:39
>> An: Mailingliste Datenformate (frueher mab-list)
>> Betreff: Re: [datenformate] RDF - Fehlende Redirects, Falsche 
>> Subjects, Gelöschte Körperschaften
>> 
>> -----BEGIN PGP SIGNED MESSAGE-----
>> Hash: SHA1
>> 
>> Am 02.10.2015 um 11:31 schrieb Hentschke, Jana:
>> 
>> > betreffend die RDF-Auslieferung kann ich berichten, dass auch wir 
>> > die
>> kommentarlose Auslieferung der Beschreibung einer anderen Ressource 
>> als suboptimal empfinden. Hintergrund dieses derzeitigen Zustandes 
>> sind tech nischen Limitierung in der aktuellen Architektur unseres 
>> Permalinkresolv ers. Diese lösen sich mit einem Umbau des 
>> Permalinkresolvers aber gerade  auf und im Anschluss wollen wir die 
>> unseres Erachtens semantisch korrek te und intuitivere Kette
>> >   "RDF-Anfrage an Umlenksatz" -> 301 -> "Zielsatz" -> 303 -> "RDF 
>> > für
>> Zielsatz"
>> > implementieren.
>> 
>> Request: http://d-nb.info/gnd/4011882-4
>>  Response: 301 Moved Permanently
>>  Location: http://d-nb.info/gnd/2006655-7
>> 
>> Request: http://d-nb.info/gnd/2006655-7
>>  Response: 303 See Other
>>  Location: http://d-nb.info/gnd/2006655-7/about/rdf
>> 
>> D.h. die BzgA existiert nicht mehr, sondern nur die BzgA, zu der dann 
>> Informationen gegeben werden :-?
>> 
>> Umgekehrt waere es auch denkbar (303, dann 301)
>> 
>> Request: http://d-nb.info/gnd/4011882-4
>> Response: 303 See Other
>> Location: http://d-nb.info/gnd/4011882-4/about/rdf
>> 
>> Request: http://d-nb.info/gnd/4011882-4/about/rdf
>> Response: 301 Moved Permanently
>> Location: http://d-nb.info/gnd/2006655-7/about/rdf
>> 
>> das wuerde m.E. staerker zum Ausdruck bringen, dass die 
>> /Beschreibungen/ zusammengefasst wurden.
>> 
>> 
>> > Außerdem wäre vielleicht die gleichzeitige Auslieferung einer 
>> > zusätzliche Aussage über die ursprünglich angefragte Ressource 
>> > hilfreich, für dieses Beispiel:
>> >
>> > <http://d-nb.info/gnd/4011882-4>
>> >   owl:sameAs http://d-nb.info/gnd/2006655-7 .
>> 
>> Immerhin wuerde damit irgendeine Aussage ueber
>> http://d-nb.info/gnd/4011882-4 getroffen. Normalerweise wuerde ich 
>> aber nicht unbedingt erwarten, dass ich unbedingt nun die Aussagen zur 
>> anderen URI konsumieren sollte, auch wenn mir die im gleichen Dokument geliefert werden.
>> 
>> Ich muss zugeben, dass mir nicht klar ist, wie man die redaktionellen 
>> Prozesse bei der Normdatenarbeit in RDF abbilden kann, zu irgendeinem 
>> Zeitpunkt in der Vergangenheit waren
>> 
>> http://d-nb.info/gnd/4011882-4
>> 
>> und
>> 
>> http://d-nb.info/gnd/2006655-7
>> 
>> getrennte Entitaeten (das war zwar nie "wahr", entsprach aber dem Wissensstand bzw.
>> spiegelte das Schisma in den Normdateien).
>> Jemand drittes haette nun mittels owl:sameAs eine "externe"
>> Identifizierung der beiden Non-Information-Resources ausdruecken koennen.
>> 
>> Aktuell wissen wir, dass es sich um dieselbe Entitaet handelt
>> *und* die redaktionelle Zusammenfuehrung hat dazu gefuehrt, dass es 
>> eine einheitliche Beschreibung gibt. Man koennte nun
>> also:
>> 
>> 1.) leicht modifizierte RDF-Darstellungen exportieren, dabei spiegelt 
>> dann das rdf:about-Attribut der RDF:description die jeweils angefragte 
>> Nummer, mittels owl:sameAs koennen dann alle Varianten aufgezaehlt 
>> werden. Totale Redundanz also, alle Legacy-Identifier werden 
>> gleichartig unterstuetzt, ein Vorzugs-Identifier kann mittels 
>> gndo-Vokabular ausgedrueckt werden. (HTTP-Redirects von einer Nummer 
>> auf die andere waeren dann allerdings kontraproduktiv)
>> 
>> 2.) wie bisher nur die RDF-Beschreibung mittels der aktuellen 
>> Vorzugs-URI ausgeben, und da sehe ich wie erwaehnt die Schwierigkeit, 
>> dass man einerseits weiterhin ausdruecken will, dass die Ressource X 
>> durchaus existiert, man aber nicht gewillt ist, weiterhin 
>> Beschreibungen dafuer zu geben, sondern eben nur einen Pointer auf die 
>> Beschreibungen fuer eine "identische" Ressource Y: Weder OWL noch SKOS 
>> scheinen hier angemessene Mechanismen zu haben (ich will ja weder die 
>> GND als Ontologie versionieren noch die Entitaeten als Klassen identischer Normsaetze noch abstrakter machen).
>> 
>> viele Gruesse
>> Thomas Berger
>> 
>> 
> 
> -----Ursprüngliche Nachricht-----
> Von: datenformate-bounces at lists.dnb.de [mailto:datenformate-bounces at lists.dnb.de] Im Auftrag von Thomas Berger
> Gesendet: Freitag, 2. Oktober 2015 11:40
> An: Mailingliste Datenformate (frueher mab-list)
> Betreff: Re: [datenformate] RDF - Fehlende Redirects, Falsche Subjects, Gelöschte Körperschaften
> 
> [...]
> 
> Dieser Hinweis ist zwar drin, aber dafuer muss man das URI-Prefix http://d-nb.info/gnd/ mit dem MARC-Prefix "(DE-588)" im String identifizieren, das liegt klarerweise ausserhalb der Verarbeitung von RDF als RDF:
> 
> 
> <rdf:Description rdf:about="http://d-nb.info/gnd/2006655-7">
>  <gndo:gndIdentifier>2006655-7</gndo:gndIdentifier>
>  <gndo:oldAuthorityNumber>(DE-588)16269969-4</gndo:oldAuthorityNumber>
> ...
> 
> Wuenschenswert waere also noch ein hypothetisches Element
> 
> <gndo:gndDeprecatedIdentifier>16269969-4</gndo:gndDeprecatedIdentifier>
> 
> und vielleicht sogar
> 
> <gndo:gndSupersedes rdf:resource="http://d-nb.info/gnd/16269969-4" />
> 
> viele Gruesse
> Thomas Berger
> 
> 
> -----Ursprüngliche Nachricht-----
> Von: datenformate-bounces at lists.dnb.de [mailto:datenformate-bounces at lists.dnb.de] Im Auftrag von Jan Schnasse
> Gesendet: Freitag, 2. Oktober 2015 10:37
> An: 'Mailingliste Datenformate (frueher mab-list)'
> Betreff: [datenformate] RDF - Fehlende Redirects, Falsche Subjects, Gelöschte Körperschaften
> 
> Liebe Kolleginnen und Kollegen,
> 
> ich stolpere gerade über eine Körperschaft (z.B. 16269969-4), für die kein RDF mehr über ihren GND-Identifier zu finden ist [1]. M.E. verhält sich die RDF-Schnittstelle hier nicht korrekt. Gehe ich direkt auf den RDF-Endpunkt http://d-nb.info/gnd/16269969-4/about/lds erhalte ich einfach einen Http-200, bekomme aber den Datensatz zur GND-ID
> 2006655-7 ausgeliefert. Dies finde ich kontraintuitiv, da ich keinen Hinweis erhalte, was mit dem eigentlich angefragten Datensatz passiert ist. Wurde er gelöscht? Warum?
> 
> [...]
> 
> Hier hat es wohl eine Umstrukturierung in der Institution gegeben, aber warum findet man nun keine Daten mehr zu der einst existierenden
> 4011882-4 ? Hintergrund: In unserem Schriftenserver wurden Publikationen zur 4011882-4 zugeordnet.
> 
> Viele Grüße
> Jan Schnasse (hbz)
> 
> 
> [1] Im Katalog bekomme ich ein Redirect (303 --> 302 --> 200) und lande dann bei http://d-nb.info/gnd/2006655-7 . So weit so gut.
> 
> --
> Jan Schnasse
> Kendenicher Str. 82, 50969 Köln
> Tel.: 016096241961
> PGP: 0xFD586C6F3D425171
> _______________________________________________
> datenformate mailing list
> datenformate at lists.dnb.de
> http://lists.dnb.de/mailman/listinfo/datenformate
> 
> 
> 
> _______________________________________________
> datenformate mailing list
> datenformate at lists.dnb.de
> http://lists.dnb.de/mailman/listinfo/datenformate
>