AW: [datenformate] Nichtsortierzeichen bei Praefixen in Personennamen via RDF

Voß, Jakob Jakob.Voss at gbv.de
Wed May 14 12:19:53 CEST 2014


Ob für Daten nun in XML, RDF, JSON, CSV oder in irgend einer anderen Datenstrukturierungssprache kodiert werden ist zweitrangig im Vergleich zur Frage welche konzeptuellen Elemente und Beziehungen durch die Daten ausgedrückt werden. Beispielsweise erfordert die Idee eines ¨Nichtsortierzeichens¨ erstmal einiges an Gehirnverknotung. Ist erstmal klar, welche Information eigentlich mit den Daten ausgedrückt werden soll, lassen sich einfach verschiedene Kodierungen entwickeln, die dank des gemeinsamen konzeptuellen Datenmodells ineinaner überführt werden können. Da Gehirnzeit in der Regel höher ist als Rechenzeit, ist es günstiger nicht auf Ebene der Kodierung sondern auf der konzeptuellen Ebene zu optimieren.

RDF hat konkret den Vorteil, dass das Mapping von den konzeptuellen Elementen in die Datenstrukturierungssprache einfacher ist als beispielsweise mit CSV. Einige würden sagen, dass eine RDF-Ontologie dem konzeptuellen Modell entspricht, so weit würde ich aber nicht gehen.

> Bis zum schlagenden Beweis meines Irrtums durch ein System, das die hergebrachten Modelle überzeugend ablösen kann, bleibe ich dabei, es als inelegant und ineffektiv zu bezeichnen, wenn das 9fache Datenvolumen gebraucht wird für denselben Inhalt. Nicht, wie gesagt, wegen des Volumens als solchem! Sondern wegen der Folgen, die das nach sich zieht, u.a. für das Handling, die Eingabe, die Programmierung etc.

Im Gegensatz zu kryptischen bibliothekarischen Datenformaten gibt es für XML, RDF & Co Standardwerkzeuge für Eingabe, Programmierung etc. Mit einer etablierten Datenstrukturierungssprache zumindest schonmal eine rudimentäre Struktur (z.B. Baum- oder Graphstruktur) auf der sich einfacher mit den Daten arbeiten lässt. Alles andere (bspw. der Versuch mit regulären Äusdrücken XML zu verarbeiten oder für die RDF-Verarbeitung ¨per Hand¨) ist einfach unprofessionell.

Schöne Grüße
Jakob Voß

--
Jakob Voß
Verbundzentrale des GBV (VZG)
Abteilung Digitale Bibliothek
Platz der Göttinger Sieben 1
37073 Göttingen
Telefon: (49)551 39-10242
Internet: www.gbv.de


More information about the datenformate mailing list