[datenformate] Nichtsortierzeichen bei Praefixen in Personennamen via RDF

Wed May 14 12:58:18 CEST 2014

Am 14.05.2014 12:19, schrieb Voß, Jakob:
> Ob für Daten nun in XML, RDF, JSON, CSV oder in irgend einer anderen
> Datenstrukturierungssprache kodiert werden ist zweitrangig im
> Vergleich zur Frage welche konzeptuellen Elemente und Beziehungen
> durch die Daten ausgedrückt werden. Beispielsweise erfordert die Idee
> eines ¨Nichtsortierzeichens¨ erstmal einiges an Gehirnverknotung.
Diese Erfahrung haben wir mit den bisher üblichen Methoden eigentlich
nicht gemacht.

> Da Gehirnzeit in der Regel höher ist als
> Rechenzeit, ist es günstiger nicht auf Ebene der Kodierung sondern
> auf der konzeptuellen Ebene zu optimieren.
>
Egal wo, man muß entscheiden, ob was markiert wird oder nicht, ich
sehe da keinen Unterschied im Endeffekt, ob man 2 Byte dafür braucht
oder 25. Was klar dagegen spricht, 25 zu nehmen.

> RDF hat konkret den Vorteil, dass das Mapping von den konzeptuellen
> Elementen in die Datenstrukturierungssprache einfacher ist als
> beispielsweise mit CSV.
CSV stand und steht nirgends zur Diskussion.

> Einige würden sagen, dass eine RDF-Ontologie
> dem konzeptuellen Modell entspricht, so weit würde ich aber nicht
> gehen.
Ist wohl auch nirgends schlüssig bewiesen, oder? Also nichts als
Hypothesen. Ob man darauf was gründen sollte, ist die Frage.

>
> Im Gegensatz zu kryptischen bibliothekarischen Datenformaten
Das wird immer so behauptet, aber was genau heißt denn kryptisch?
Dokumentiert ist MARC immerhin so akribisch wie sonst nichts.
Und es geht alles durch einen sehr langen Prozeß, bevor es kodifiziert
wird. Meinen Sie mit "kryptisch" vielleicht "kenntnislastig",
also mit hohem Lernbedarf belastet? Und das ließe sich mit
RDF z.B. mildern? Ist das erwiesen?

> ... gibt es
> für XML, RDF & Co Standardwerkzeuge für Eingabe, Programmierung etc.
> Mit einer etablierten Datenstrukturierungssprache zumindest schonmal
> eine rudimentäre Struktur (z.B. Baum- oder Graphstruktur) auf der
> sich einfacher mit den Daten arbeiten lässt. Alles andere (bspw. der
> Versuch mit regulären Äusdrücken XML zu verarbeiten oder für die
> RDF-Verarbeitung ¨per Hand¨) ist einfach unprofessionell.
Das hat auch keiner vorgeschlagen. Aber bewiesen hat auch keiner, daß
man ein operativ effizientes und elegantes Erfassungs-, Bearbeitungs-,
Präsentations- und Datenmanagementsystem mit den neuen Mitteln, Moden
und Methoden machen kann. Eines, das es an Effizienz aufnehmen kann
mit Dingen, die wir haben. Sonst hat's keinen Zweck. Sie sehen doch
gerade am Beispiel des Nichtsortierzeichens, wie unheimlich schwer was
zu bewegen ist auf dem Gebiet! Letztlich geht es ja um eine bezahlbare
Migration von tausenden von Systemen mit jeweils einem Rattenschwanz
von daran hängenden Vor- und Geschäftsgängen und natürlich auch dem
Knowhow aller damit befaßten Leute bzw. deren Umerziehung. Aber
vielleicht könnte ja auch nur noch ein revolutionärer Umsturz helfen.
Wobei vieles und viele auf der Strecke bleiben würden, aber das ist
nun mal immer so in solchen Fällen. Die jetzt noch bestehende globale
Einheitlichkeit bibliothekarischer Systeme wäre erat mal für lange Zeit 
dahin.
Realistisch ist, denke ich, daß RDF-Daten etc. für lange Zeit bloße
Nebenprodukte sein werden, die sich zunächst nur in Marktnischen
etablieren können. Schon jetzt kann man sie aus Interndaten ableiten,
das wird ja vielerorts getan. Aber die Interndaten dadurch ersetzen, das
ist ein ganz anderes Thema. Es wird auf überzeugende Leistungen
ankommen, aber beiweitem nicht nur das.
Haben Sie sich, ganz nebenbei, den Bibfrage-Editor schon angeschaut?
Könnten Sie vielleicht was Besseres machen?

Viel Erfolg damit!

B.E.