[gnd-ontology] GND-Umlenkungen im Linked Data Service (war: [datenformate] RDF - Fehlende Redirects, Falsche Subjects, Gelöschte Körperschaften)

David Maus maus at hab.de
Mon Okt 19 16:44:40 CEST 2015


Liebe Frau Hentschke,

Mglw. lässt sich die 301 Weiterleitung mit Angabe einer Link-Relation
(RFC 5988) semantisch anreichern.

=> Request: http://d-nb.info/gnd/4011882-4
<= HTTP/1.1 301 Moved Permanently
   Location: http://d-nb.info/gnd/2006655-7
   Link: <http://d-nb.info/gnd/2006655-7>; rel="canonical"

Registrierte Link-Relationen finden sich hier

http://www.iana.org/assignments/link-relations/link-relations.xhtml

Mit besten Grüßen,
  -- David Maus

On Mon, 19 Oct 2015 16:30:37 +0200,
Hentschke, Jana wrote:
> 
> + + + + diese Diskussion begann in der Mailingliste Datenformate <datenformate at lists.dnb.de> + + + +
> + + + + ich erweitere jetzt auf die Mailingliste <gnd-ontology at lists.dnb.de> + + + +
> 
> Liebe Listenteilnehmer*,
> 
> ich fasse für die GND-Ontology-Liste mal kurz zusammen: GND-Umlenkungen werden aktuell im Linked Data Service der DNB nicht gut umgesetzt:
> bei der Anforderung einer RDF-Beschreibung für eine umgelenkte GND-Ressource wird kommentarlos die Beschreibung einer anderen Ressource (des Zielsatzes der Umlenkung) ausgeliefert. Aus dieser Beschreibung geht nicht (maschineninterpretierbar) hervor, wie sich die angefragte Ressource zu der dann beschriebenen verhält.
> 
> Ein Beispiel:
> http://d-nb.info/gnd/4011882-4 -> http://d-nb.info/gnd/2006655-7
> 
> Unabhängig von der Frage, ob wir, wie von Herrn Berger vorgeschlagen, eine verallgemeinernde Typologie der Vorgänge rund um den Lebenszyklus von Normsätzen brauchen, möchten wir hier eine kurzfristige Lösung für die GND-Umlenksätze in RDF vorschlagen.
>  
> Anforderungen:
> 1) nachnutzende Systeme sollen Änderungen automatisiert nachvollziehen können
> 2) alle jemals geprägten URIs sollen nutzbar bleiben
> 3) gleichzeitig soll deutlich werden, welches die aktuelle bevorzugte Referenzierung einer GND-Entität ist 
> 
> Mit der Weiterleitung
> 
>   Request: http://d-nb.info/gnd/4011882-4
>   Response: 301 Moved Permanently
>   Location: http://d-nb.info/gnd/2006655-7
> 
> soll deutlich gemacht werden, dass sich die bevorzugte Referenzierung der Entität geändert hat.
> 
> Im RDF würden wir dann die zusätzliche Aussage
> 
> <http://d-nb.info/gnd/2006655-7>
>   owl:sameAs http://d-nb.info/gnd/4011882-4 .
> 
> unterbringen. Wir sehen keinen Anlass für eine neue gndo-Property (vorgeschlagen waren z.B. gndo:deprecatedIdentifier oder gndo:supersedes).
> 
> Um auch in den GND-Dumpdateien Informationen zu den alten URIs zu liefern, soll zusätzlich die inverse sameAs-Aussage
> 
> <http://d-nb.info/gnd/4011882-4>
>   owl:sameAs http://d-nb.info/gnd/2006655-7 .
> 
> einfügt werden.
> 
> 
> Wir haben uns damit dagegen entschieden, identische Beschreibungen mit unterschiedlichen Subjekten unter den verschiedenen URIs auszuliefern, weil so unseres Erachtens Anforderung 3 nicht genug unterstützt würde (denn langfristig erscheint es vor dem Hintergrund zukünftiger Datenzusammenführungen wünschenswert, möglichst großflächig dieselben URIs zu verwenden).
> 
> 
> Weitere Gedanken zu dieser Lösung sind willkommen!
> 
> Besten Gruß von
> Jana Hentschke
> 
> 
> 
> *** Lesen. Hören. Wissen. Deutsche Nationalbibliothek *** 
>  
> --
> Jana Hentschke
> Deutsche Nationalbibliothek
> Informationsinfrastruktur
> Adickesallee 1
> D-60322 Frankfurt am Main
> Telefon: +49-69-1525-1773
> Telefax: +49-69-1525-1799
> mailto:j.hentschke at dnb.de
> http://www.dnb.de  
> 
> 
> 
> 
> 
> > -----Ursprüngliche Nachricht-----
> > Von: datenformate-bounces at lists.dnb.de 
> > [mailto:datenformate-bounces at lists.dnb.de]
> > Im Auftrag von Thomas Berger
> > Gesendet: Freitag, 2. Oktober 2015 12:39
> > An: Mailingliste Datenformate (frueher mab-list)
> > Betreff: Re: [datenformate] RDF - Fehlende Redirects, Falsche 
> > Subjects, Gelöschte Körperschaften
> > 
> > -----BEGIN PGP SIGNED MESSAGE-----
> > Hash: SHA1
> > 
> > Am 02.10.2015 um 11:31 schrieb Hentschke, Jana:
> > 
> > > betreffend die RDF-Auslieferung kann ich berichten, dass auch wir 
> > > die
> > kommentarlose Auslieferung der Beschreibung einer anderen Ressource 
> > als suboptimal empfinden. Hintergrund dieses derzeitigen Zustandes 
> > sind tech nischen Limitierung in der aktuellen Architektur unseres 
> > Permalinkresolv ers. Diese lösen sich mit einem Umbau des 
> > Permalinkresolvers aber gerade  auf und im Anschluss wollen wir die 
> > unseres Erachtens semantisch korrek te und intuitivere Kette
> > >   "RDF-Anfrage an Umlenksatz" -> 301 -> "Zielsatz" -> 303 -> "RDF 
> > > für
> > Zielsatz"
> > > implementieren.
> > 
> > Request: http://d-nb.info/gnd/4011882-4
> >  Response: 301 Moved Permanently
> >  Location: http://d-nb.info/gnd/2006655-7
> > 
> > Request: http://d-nb.info/gnd/2006655-7
> >  Response: 303 See Other
> >  Location: http://d-nb.info/gnd/2006655-7/about/rdf
> > 
> > D.h. die BzgA existiert nicht mehr, sondern nur die BzgA, zu der dann 
> > Informationen gegeben werden :-?
> > 
> > Umgekehrt waere es auch denkbar (303, dann 301)
> > 
> > Request: http://d-nb.info/gnd/4011882-4
> > Response: 303 See Other
> > Location: http://d-nb.info/gnd/4011882-4/about/rdf
> > 
> > Request: http://d-nb.info/gnd/4011882-4/about/rdf
> > Response: 301 Moved Permanently
> > Location: http://d-nb.info/gnd/2006655-7/about/rdf
> > 
> > das wuerde m.E. staerker zum Ausdruck bringen, dass die 
> > /Beschreibungen/ zusammengefasst wurden.
> > 
> > 
> > > Außerdem wäre vielleicht die gleichzeitige Auslieferung einer 
> > > zusätzliche Aussage über die ursprünglich angefragte Ressource 
> > > hilfreich, für dieses Beispiel:
> > >
> > > <http://d-nb.info/gnd/4011882-4>
> > >   owl:sameAs http://d-nb.info/gnd/2006655-7 .
> > 
> > Immerhin wuerde damit irgendeine Aussage ueber
> > http://d-nb.info/gnd/4011882-4 getroffen. Normalerweise wuerde ich 
> > aber nicht unbedingt erwarten, dass ich unbedingt nun die Aussagen zur 
> > anderen URI konsumieren sollte, auch wenn mir die im gleichen Dokument geliefert werden.
> > 
> > Ich muss zugeben, dass mir nicht klar ist, wie man die redaktionellen 
> > Prozesse bei der Normdatenarbeit in RDF abbilden kann, zu irgendeinem 
> > Zeitpunkt in der Vergangenheit waren
> > 
> > http://d-nb.info/gnd/4011882-4
> > 
> > und
> > 
> > http://d-nb.info/gnd/2006655-7
> > 
> > getrennte Entitaeten (das war zwar nie "wahr", entsprach aber dem Wissensstand bzw.
> > spiegelte das Schisma in den Normdateien).
> > Jemand drittes haette nun mittels owl:sameAs eine "externe"
> > Identifizierung der beiden Non-Information-Resources ausdruecken koennen.
> > 
> > Aktuell wissen wir, dass es sich um dieselbe Entitaet handelt
> > *und* die redaktionelle Zusammenfuehrung hat dazu gefuehrt, dass es 
> > eine einheitliche Beschreibung gibt. Man koennte nun
> > also:
> > 
> > 1.) leicht modifizierte RDF-Darstellungen exportieren, dabei spiegelt 
> > dann das rdf:about-Attribut der RDF:description die jeweils angefragte 
> > Nummer, mittels owl:sameAs koennen dann alle Varianten aufgezaehlt 
> > werden. Totale Redundanz also, alle Legacy-Identifier werden 
> > gleichartig unterstuetzt, ein Vorzugs-Identifier kann mittels 
> > gndo-Vokabular ausgedrueckt werden. (HTTP-Redirects von einer Nummer 
> > auf die andere waeren dann allerdings kontraproduktiv)
> > 
> > 2.) wie bisher nur die RDF-Beschreibung mittels der aktuellen 
> > Vorzugs-URI ausgeben, und da sehe ich wie erwaehnt die Schwierigkeit, 
> > dass man einerseits weiterhin ausdruecken will, dass die Ressource X 
> > durchaus existiert, man aber nicht gewillt ist, weiterhin 
> > Beschreibungen dafuer zu geben, sondern eben nur einen Pointer auf die 
> > Beschreibungen fuer eine "identische" Ressource Y: Weder OWL noch SKOS 
> > scheinen hier angemessene Mechanismen zu haben (ich will ja weder die 
> > GND als Ontologie versionieren noch die Entitaeten als Klassen identischer Normsaetze noch abstrakter machen).
> > 
> > viele Gruesse
> > Thomas Berger
> > 
> > 
> 
> -----Ursprüngliche Nachricht-----
> Von: datenformate-bounces at lists.dnb.de [mailto:datenformate-bounces at lists.dnb.de] Im Auftrag von Thomas Berger
> Gesendet: Freitag, 2. Oktober 2015 11:40
> An: Mailingliste Datenformate (frueher mab-list)
> Betreff: Re: [datenformate] RDF - Fehlende Redirects, Falsche Subjects, Gelöschte Körperschaften
> 
> [...]
> 
> Dieser Hinweis ist zwar drin, aber dafuer muss man das URI-Prefix http://d-nb.info/gnd/ mit dem MARC-Prefix "(DE-588)" im String identifizieren, das liegt klarerweise ausserhalb der Verarbeitung von RDF als RDF:
> 
> 
> <rdf:Description rdf:about="http://d-nb.info/gnd/2006655-7">
>  <gndo:gndIdentifier>2006655-7</gndo:gndIdentifier>
>  <gndo:oldAuthorityNumber>(DE-588)16269969-4</gndo:oldAuthorityNumber>
> ...
> 
> Wuenschenswert waere also noch ein hypothetisches Element
> 
> <gndo:gndDeprecatedIdentifier>16269969-4</gndo:gndDeprecatedIdentifier>
> 
> und vielleicht sogar
> 
> <gndo:gndSupersedes rdf:resource="http://d-nb.info/gnd/16269969-4" />
> 
> viele Gruesse
> Thomas Berger
> 
> 
> -----Ursprüngliche Nachricht-----
> Von: datenformate-bounces at lists.dnb.de [mailto:datenformate-bounces at lists.dnb.de] Im Auftrag von Jan Schnasse
> Gesendet: Freitag, 2. Oktober 2015 10:37
> An: 'Mailingliste Datenformate (frueher mab-list)'
> Betreff: [datenformate] RDF - Fehlende Redirects, Falsche Subjects, Gelöschte Körperschaften
> 
> Liebe Kolleginnen und Kollegen,
> 
> ich stolpere gerade über eine Körperschaft (z.B. 16269969-4), für die kein RDF mehr über ihren GND-Identifier zu finden ist [1]. M.E. verhält sich die RDF-Schnittstelle hier nicht korrekt. Gehe ich direkt auf den RDF-Endpunkt http://d-nb.info/gnd/16269969-4/about/lds erhalte ich einfach einen Http-200, bekomme aber den Datensatz zur GND-ID
> 2006655-7 ausgeliefert. Dies finde ich kontraintuitiv, da ich keinen Hinweis erhalte, was mit dem eigentlich angefragten Datensatz passiert ist. Wurde er gelöscht? Warum?
> 
> [...]
> 
> Hier hat es wohl eine Umstrukturierung in der Institution gegeben, aber warum findet man nun keine Daten mehr zu der einst existierenden
> 4011882-4 ? Hintergrund: In unserem Schriftenserver wurden Publikationen zur 4011882-4 zugeordnet.
> 
> Viele Grüße
> Jan Schnasse (hbz)
> 
> 
> [1] Im Katalog bekomme ich ein Redirect (303 --> 302 --> 200) und lande dann bei http://d-nb.info/gnd/2006655-7 . So weit so gut.
> 
> --
> Jan Schnasse
> Kendenicher Str. 82, 50969 Köln
> Tel.: 016096241961
> PGP: 0xFD586C6F3D425171
> _______________________________________________
> datenformate mailing list
> datenformate at lists.dnb.de
> http://lists.dnb.de/mailman/listinfo/datenformate
> 

-- 
David Maus
Herzog August Bibliothek - D-38299 Wolfenbuettel
Bibliothekarische IT / Digital Humanities
Phone: +49-5331-808-317
Email: maus at hab.de

PGP Key 0x7B4F5A762AF6FBA6
Fingerprint DD38 8D2E 34C1 94DE 2058  69BE 7B4F 5A76 2AF6 FBA6