[gnd-ontology] GND-Umlenkungen im Linked Data Service (war: [datenformate] RDF - Fehlende Redirects, Falsche Subjects, Gelöschte Körperschaften)

Hentschke, Jana J.Hentschke at dnb.de
Mon Okt 19 16:30:37 CEST 2015


+ + + + diese Diskussion begann in der Mailingliste Datenformate <datenformate at lists.dnb.de> + + + +
+ + + + ich erweitere jetzt auf die Mailingliste <gnd-ontology at lists.dnb.de> + + + +

Liebe Listenteilnehmer*,

ich fasse für die GND-Ontology-Liste mal kurz zusammen: GND-Umlenkungen werden aktuell im Linked Data Service der DNB nicht gut umgesetzt:
bei der Anforderung einer RDF-Beschreibung für eine umgelenkte GND-Ressource wird kommentarlos die Beschreibung einer anderen Ressource (des Zielsatzes der Umlenkung) ausgeliefert. Aus dieser Beschreibung geht nicht (maschineninterpretierbar) hervor, wie sich die angefragte Ressource zu der dann beschriebenen verhält.

Ein Beispiel:
http://d-nb.info/gnd/4011882-4 -> http://d-nb.info/gnd/2006655-7

Unabhängig von der Frage, ob wir, wie von Herrn Berger vorgeschlagen, eine verallgemeinernde Typologie der Vorgänge rund um den Lebenszyklus von Normsätzen brauchen, möchten wir hier eine kurzfristige Lösung für die GND-Umlenksätze in RDF vorschlagen.
 
Anforderungen:
1) nachnutzende Systeme sollen Änderungen automatisiert nachvollziehen können
2) alle jemals geprägten URIs sollen nutzbar bleiben
3) gleichzeitig soll deutlich werden, welches die aktuelle bevorzugte Referenzierung einer GND-Entität ist 

Mit der Weiterleitung

  Request: http://d-nb.info/gnd/4011882-4
  Response: 301 Moved Permanently
  Location: http://d-nb.info/gnd/2006655-7

soll deutlich gemacht werden, dass sich die bevorzugte Referenzierung der Entität geändert hat.

Im RDF würden wir dann die zusätzliche Aussage

<http://d-nb.info/gnd/2006655-7>
  owl:sameAs http://d-nb.info/gnd/4011882-4 .

unterbringen. Wir sehen keinen Anlass für eine neue gndo-Property (vorgeschlagen waren z.B. gndo:deprecatedIdentifier oder gndo:supersedes).

Um auch in den GND-Dumpdateien Informationen zu den alten URIs zu liefern, soll zusätzlich die inverse sameAs-Aussage

<http://d-nb.info/gnd/4011882-4>
  owl:sameAs http://d-nb.info/gnd/2006655-7 .

einfügt werden.


Wir haben uns damit dagegen entschieden, identische Beschreibungen mit unterschiedlichen Subjekten unter den verschiedenen URIs auszuliefern, weil so unseres Erachtens Anforderung 3 nicht genug unterstützt würde (denn langfristig erscheint es vor dem Hintergrund zukünftiger Datenzusammenführungen wünschenswert, möglichst großflächig dieselben URIs zu verwenden).


Weitere Gedanken zu dieser Lösung sind willkommen!

Besten Gruß von
Jana Hentschke



*** Lesen. Hören. Wissen. Deutsche Nationalbibliothek *** 
 
--
Jana Hentschke
Deutsche Nationalbibliothek
Informationsinfrastruktur
Adickesallee 1
D-60322 Frankfurt am Main
Telefon: +49-69-1525-1773
Telefax: +49-69-1525-1799
mailto:j.hentschke at dnb.de
http://www.dnb.de  





> -----Ursprüngliche Nachricht-----
> Von: datenformate-bounces at lists.dnb.de 
> [mailto:datenformate-bounces at lists.dnb.de]
> Im Auftrag von Thomas Berger
> Gesendet: Freitag, 2. Oktober 2015 12:39
> An: Mailingliste Datenformate (frueher mab-list)
> Betreff: Re: [datenformate] RDF - Fehlende Redirects, Falsche 
> Subjects, Gelöschte Körperschaften
> 
> -----BEGIN PGP SIGNED MESSAGE-----
> Hash: SHA1
> 
> Am 02.10.2015 um 11:31 schrieb Hentschke, Jana:
> 
> > betreffend die RDF-Auslieferung kann ich berichten, dass auch wir 
> > die
> kommentarlose Auslieferung der Beschreibung einer anderen Ressource 
> als suboptimal empfinden. Hintergrund dieses derzeitigen Zustandes 
> sind tech nischen Limitierung in der aktuellen Architektur unseres 
> Permalinkresolv ers. Diese lösen sich mit einem Umbau des 
> Permalinkresolvers aber gerade  auf und im Anschluss wollen wir die 
> unseres Erachtens semantisch korrek te und intuitivere Kette
> >   "RDF-Anfrage an Umlenksatz" -> 301 -> "Zielsatz" -> 303 -> "RDF 
> > für
> Zielsatz"
> > implementieren.
> 
> Request: http://d-nb.info/gnd/4011882-4
>  Response: 301 Moved Permanently
>  Location: http://d-nb.info/gnd/2006655-7
> 
> Request: http://d-nb.info/gnd/2006655-7
>  Response: 303 See Other
>  Location: http://d-nb.info/gnd/2006655-7/about/rdf
> 
> D.h. die BzgA existiert nicht mehr, sondern nur die BzgA, zu der dann 
> Informationen gegeben werden :-?
> 
> Umgekehrt waere es auch denkbar (303, dann 301)
> 
> Request: http://d-nb.info/gnd/4011882-4
> Response: 303 See Other
> Location: http://d-nb.info/gnd/4011882-4/about/rdf
> 
> Request: http://d-nb.info/gnd/4011882-4/about/rdf
> Response: 301 Moved Permanently
> Location: http://d-nb.info/gnd/2006655-7/about/rdf
> 
> das wuerde m.E. staerker zum Ausdruck bringen, dass die 
> /Beschreibungen/ zusammengefasst wurden.
> 
> 
> > Außerdem wäre vielleicht die gleichzeitige Auslieferung einer 
> > zusätzliche Aussage über die ursprünglich angefragte Ressource 
> > hilfreich, für dieses Beispiel:
> >
> > <http://d-nb.info/gnd/4011882-4>
> >   owl:sameAs http://d-nb.info/gnd/2006655-7 .
> 
> Immerhin wuerde damit irgendeine Aussage ueber
> http://d-nb.info/gnd/4011882-4 getroffen. Normalerweise wuerde ich 
> aber nicht unbedingt erwarten, dass ich unbedingt nun die Aussagen zur 
> anderen URI konsumieren sollte, auch wenn mir die im gleichen Dokument geliefert werden.
> 
> Ich muss zugeben, dass mir nicht klar ist, wie man die redaktionellen 
> Prozesse bei der Normdatenarbeit in RDF abbilden kann, zu irgendeinem 
> Zeitpunkt in der Vergangenheit waren
> 
> http://d-nb.info/gnd/4011882-4
> 
> und
> 
> http://d-nb.info/gnd/2006655-7
> 
> getrennte Entitaeten (das war zwar nie "wahr", entsprach aber dem Wissensstand bzw.
> spiegelte das Schisma in den Normdateien).
> Jemand drittes haette nun mittels owl:sameAs eine "externe"
> Identifizierung der beiden Non-Information-Resources ausdruecken koennen.
> 
> Aktuell wissen wir, dass es sich um dieselbe Entitaet handelt
> *und* die redaktionelle Zusammenfuehrung hat dazu gefuehrt, dass es 
> eine einheitliche Beschreibung gibt. Man koennte nun
> also:
> 
> 1.) leicht modifizierte RDF-Darstellungen exportieren, dabei spiegelt 
> dann das rdf:about-Attribut der RDF:description die jeweils angefragte 
> Nummer, mittels owl:sameAs koennen dann alle Varianten aufgezaehlt 
> werden. Totale Redundanz also, alle Legacy-Identifier werden 
> gleichartig unterstuetzt, ein Vorzugs-Identifier kann mittels 
> gndo-Vokabular ausgedrueckt werden. (HTTP-Redirects von einer Nummer 
> auf die andere waeren dann allerdings kontraproduktiv)
> 
> 2.) wie bisher nur die RDF-Beschreibung mittels der aktuellen 
> Vorzugs-URI ausgeben, und da sehe ich wie erwaehnt die Schwierigkeit, 
> dass man einerseits weiterhin ausdruecken will, dass die Ressource X 
> durchaus existiert, man aber nicht gewillt ist, weiterhin 
> Beschreibungen dafuer zu geben, sondern eben nur einen Pointer auf die 
> Beschreibungen fuer eine "identische" Ressource Y: Weder OWL noch SKOS 
> scheinen hier angemessene Mechanismen zu haben (ich will ja weder die 
> GND als Ontologie versionieren noch die Entitaeten als Klassen identischer Normsaetze noch abstrakter machen).
> 
> viele Gruesse
> Thomas Berger
> 
> 

-----Ursprüngliche Nachricht-----
Von: datenformate-bounces at lists.dnb.de [mailto:datenformate-bounces at lists.dnb.de] Im Auftrag von Thomas Berger
Gesendet: Freitag, 2. Oktober 2015 11:40
An: Mailingliste Datenformate (frueher mab-list)
Betreff: Re: [datenformate] RDF - Fehlende Redirects, Falsche Subjects, Gelöschte Körperschaften

[...]

Dieser Hinweis ist zwar drin, aber dafuer muss man das URI-Prefix http://d-nb.info/gnd/ mit dem MARC-Prefix "(DE-588)" im String identifizieren, das liegt klarerweise ausserhalb der Verarbeitung von RDF als RDF:


<rdf:Description rdf:about="http://d-nb.info/gnd/2006655-7">
 <gndo:gndIdentifier>2006655-7</gndo:gndIdentifier>
 <gndo:oldAuthorityNumber>(DE-588)16269969-4</gndo:oldAuthorityNumber>
...

Wuenschenswert waere also noch ein hypothetisches Element

<gndo:gndDeprecatedIdentifier>16269969-4</gndo:gndDeprecatedIdentifier>

und vielleicht sogar

<gndo:gndSupersedes rdf:resource="http://d-nb.info/gnd/16269969-4" />

viele Gruesse
Thomas Berger


-----Ursprüngliche Nachricht-----
Von: datenformate-bounces at lists.dnb.de [mailto:datenformate-bounces at lists.dnb.de] Im Auftrag von Jan Schnasse
Gesendet: Freitag, 2. Oktober 2015 10:37
An: 'Mailingliste Datenformate (frueher mab-list)'
Betreff: [datenformate] RDF - Fehlende Redirects, Falsche Subjects, Gelöschte Körperschaften

Liebe Kolleginnen und Kollegen,

ich stolpere gerade über eine Körperschaft (z.B. 16269969-4), für die kein RDF mehr über ihren GND-Identifier zu finden ist [1]. M.E. verhält sich die RDF-Schnittstelle hier nicht korrekt. Gehe ich direkt auf den RDF-Endpunkt http://d-nb.info/gnd/16269969-4/about/lds erhalte ich einfach einen Http-200, bekomme aber den Datensatz zur GND-ID
2006655-7 ausgeliefert. Dies finde ich kontraintuitiv, da ich keinen Hinweis erhalte, was mit dem eigentlich angefragten Datensatz passiert ist. Wurde er gelöscht? Warum?

[...]

Hier hat es wohl eine Umstrukturierung in der Institution gegeben, aber warum findet man nun keine Daten mehr zu der einst existierenden
4011882-4 ? Hintergrund: In unserem Schriftenserver wurden Publikationen zur 4011882-4 zugeordnet.

Viele Grüße
Jan Schnasse (hbz)


[1] Im Katalog bekomme ich ein Redirect (303 --> 302 --> 200) und lande dann bei http://d-nb.info/gnd/2006655-7 . So weit so gut.

--
Jan Schnasse
Kendenicher Str. 82, 50969 Köln
Tel.: 016096241961
PGP: 0xFD586C6F3D425171
_______________________________________________
datenformate mailing list
datenformate at lists.dnb.de
http://lists.dnb.de/mailman/listinfo/datenformate