Re: [datenformate] RDF - Fehlende Redirects, Falsche Subjects, Gelöschte Körperschaften

Christoph, Pascal christoph at hbz-nrw.de
Tue Oct 6 15:09:03 CEST 2015


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA256

Thomas Berger wrote on 05.10.2015 13:04 :

> Am 05.10.2015 um 11:52 schrieb Jan Schnasse:

[...]

>> D.h. dieselben Daten werden unter verschiedenen URLs mit verschiedenen 
>> Subjects angeboten. Als Konsument fände ich diese Variante in Ordnung. 
>> Durch die angebotenen Links könnte ich bei Gelegenheit auf die 
>> Vorzugs-IDs migrieren, oder eben auf den historischen IDs bleiben.
> 
> Mit einer "redaktionellen" Brille wuerde ich mir wuenschen, dass durchaus 
> ein gewisser Druck aufgebaut wird, auf die Nutzung abgeschaffter 
> Identifier zumindest mittelfristig zu verzichten.
> 
>> Apropos historisch: Was passiert eigentlich, wenn eine Institution 
>> aufgelöst, umbenannt oder umstrukturiert wird? Dann bleiben die alten 
>> Identifier aber schon bestehen, oder? Auch bei Umbenennungen werden
>> neue IDs geprägt, richtig?
> 
> Sicher, die Lebensdauer der Entitaet und die der zugehoerigen 
> Beschreibung(en) sind voellig unabhaengig voneinander. Bloss weil etwas 
> aufgehoert hat zu existieren, wollen wir ja nicht suggerieren, es habe 
> niemals existiert... Im Prinzip ist also alles was hier gesagt wird, und 
> worueber etwas gesagt wird, "ewig" in bester bibliothekarischer
> Tradition, wobei wir aber gluecklicherweise den Anspruch ueber Bord
> geworfen haben, stets und direkt im ersten Anlauf absolut korrekt und
> vollstaendig in unseren Aussagen zu sein.
> 
> Insofern sollten wir auch die ueblichen redaktionellen Ereignisse im 
> Umfeld unserer Normateien, also u.B. Splits und Merges von
> Beschreibungen, als ganz normal auffassen und nicht nur als das Flicken
> von Unfaellen, die eigentlich gar nicht haetten passieren duerfen, wenn
> nur alle sorgfaeltig genug gearbeitet haetten. Sowie ich das ueberblicke,
> broeseln da weltweit alle im Rahmen ihrer Redaktionsrichtlinien vor sich
> hin und versuchen das richtige zu tun, eine verallgemeinernde Typologie
> der Vorgaenge (eine formale Beschreibung des Workflows?) gibt es aber
> nicht. Auch FRAD konstatiert zwar, dass mit den Entitaeten (z.B.
> Koerperschaften) allerhand drastische Dinge wie Umbenennungen, Splits und
> Merges, passieren koennen, und wie Normdaten das reflektieren koennen,
> geht aber nicht auf das Handling von Artefakten auf Beschreibungsebene
> ein.

Wobei das wichtig wäre. Vielleicht ein Dini-KIM Projekt?

Die Frage ist: lohnt sich der Aufwand ?

Eine Argumentation _für_ eine Beibehaltung von IDs ist:

- - IDs sind unendlich und kosten nichts
- - Provenance (was wurde (am Besten noch: wann) zu was (mergen + splits)) =>
Nachvollziehbarkeit
- - kein Brechen von Systeme (siehe auch mein Blogpost[1])

Der letzte Punkt ist wichtig.

A priori:
Werden die IDs überhaupt von anderen *verwendet*, und in welcher Weise?[2]
Früher, in geschlossenen Bibliothekssysteme, konnten Splits/Merges
abgesprochen gehandhabt werden. Wenn aber die IDs in anderen Systemen
auftauchen, wie z.B. der Wikipedia, bedeutet der Wegfall einer ID (*ohne*
z.B. Weiterleitung) eine Menge (redaktioneller) Arbeit in den nachgelagerten
Systemen (das ist zudem oftmals eine Kette, z.B. Datenbanken, die ihre Daten
aus dbpedia (<- Wikipedia) verwenden).

Wird die ID also in nachgelagerten Systemen verwendet, und diese ID soll nun
nicht mehr verwendet werden, dann gibt es folgende Möglichkeiten:

a). (Status Quo): Das originäre System macht Änderungen _ohne_ dass
nachnutzende Systeme diese Änderungen automatisiert nachvollziehen können. In
der Konsequenz werden die IDs in allen (?) Systemen _irgendwann_ "vielleicht"
geändert. ZWischenzeitlich sind diese Syteme an der Stelle unbrauchbar.
b). es wird *einmal* (nämlich an der Quelle) klar gemacht, wie die ID nun zu
interpretieren ist (Redirect, oder owl:sameAs etc.). Die ID bleibt dazu
weiterhin aufrufbar.

Die Frage ist: was erwarte ich von meinen IDs - *sind sie dieser Pflege
wert*? Was erwarten die Konsumenten von den IDs?

Dass das Netz so zerissen ist (kaputte URLs),wie es ist, finde ich schade.
Ich meine, in vielen Fällen wäre es lohnend, die Netze _nicht_ zerreissen zu
lassen, und der zu betreibende Aufwand ist oft _geringer_, als die
Verwüstungen, die durch kaputte IDs entstehn.

viele Grüße, pascal


[1]http://www.dr0i.de/lib/2011/12/23/german_isil_identifer_not_very_reliable
[2]Unsere lobid.org-IDs genügen nämlich meinem eigenen Desiderat nicht. Aber
ich sehe hier auch momentan wenig Handlungsbedarf.

> viele Gruesse Thomas Berger 
> _______________________________________________ datenformate mailing list 
> datenformate at lists.dnb.de 
> http://lists.dnb.de/mailman/listinfo/datenformate
> 

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v2

iQEcBAEBCAAGBQJWE8fvAAoJEODtfnTCi82TB5QH/0ijGZCQts6lUofSbAum51pn
IJvu3QgzsU+kBV98BBSCXGoQxas4SDJZkXehHUB4d7eoV+RXJWBn1CFnrMq7ptmb
Iav2mzUunhBJZNDb8VExV1WRxvzr1q0noBjlVCfYZZyjcFhz8zwxIXdXKy7xJKOZ
LWifrXPFSF0hq8jYpJGSnz5Omu8yG3hEtrHSG9sBsJmcc8CDEt8VCtoDASdrF7xR
xOa4b71AmFk5QJJ4XJZ6FtDgQ7NK51cbIPHJh9TDKDFYq4uN0CNd/9I6JVPCWVci
LpdWxaQW7sdx3pe3lssAEUTIkRwnQPbw6TSlnKjo8/sTFGP4n0LaTl0EK6elG/g=
=48L5
-----END PGP SIGNATURE-----


More information about the datenformate mailing list