[rak-list] Standard XML schema for MARC 21

Thomas Berger ThB at gymel.com
Thu Jun 6 12:32:54 CEST 2002


Lieber Herr Eversberg,

sie fragten:

> ABER trotzdem: wieso muss es heissen
> 
> <datafield tag="260" ind1="" ind2="">
> <subfield code="a">New York :</subfield>
> 
> und nicht
> <field tag="260" ind1="" ind2="">

weil es ausser den "datafield"-Elementen auch noch
"controlfield"-Elemente gibt (die vor allen "datafields"
stehen muessen, wenn ich das Schema richtig lese,
die Reihenfolge der "controlfields" und "datafields"
untereinander ist ansonsten nicht vorgegeben).
Warum zwischen "datafields" und "controlfields" unterschieden
wird (schliesslich sind ja alles nur Daten...) ist
eine formatphilosophische Entscheidung.

> <sub code="a">New York :</sub>

und was ist "sub"? Ein Unterprogramm? Ein Subjekt? Ein
subject? Die "substance" des Felds? Ist also "New York"
aus "<sub code='a'>" eine gesichertere Erkenntnis als 
"H. Holt" aus "<sub code='b'>? 
Die Idee ist doch, die Daten so auszuzeichnen (engl: "taggen"),
dass sie sprechend werden. Denn sonst braucht man immer
noch ein Extra-Dokument das zusaetzlich zu einer Spezifikation
noch den Sprachgebrauch und die Semantik transportiert
und intellektuelle Leistung, beim Lesen die Abkuerzungen
in Bedeutungen zu uebersetzen.
MARCXML geht nicht so weit wie Dublin Core, die Nummern
der MARC-Felder in Namen zu uebersetzen, das liegt aber
zum Teil eher an der Praxis der Datenerfassung in MARC-Land
(alles huebsch mit Feldnummern, die sind alle verinnerlicht)
und auch daran, dass es nicht besonders einfach und auch
ziemlich streitkraeftig waere, den Sachverhalten, die von
einzelnen Feldern abgedeckt werden, geeignete merkbare
Namen zuzuordnen (vgl. das verwandte Problem der Umsetzung
eines Klassifikationssystems in enge Schlagworte)


> Auch das ist richtig, ABER auch deswegen waeren kuerzere XML-Tags sinnvoll, weil
> man die ja immer auch beim Programmieren jedesmal als solche hinschreiben muss!

Ein Streit, der vermutlich erst seit 35 Jahren unter 
Programmierern auf kleiner Flamme laeuft: Sollen besonders
wichtige (oft benutzte) Variable moeglichst kurze oder
besonders sprechende Namen haben? 
 


> >... auch fuer XML gilt das, was fuer MAB und
> > MARC gesagt wurde: Es ist vornehmlich ein Austauschformat
> > fuer Daten (etwa auch zwischen Anwendungen auf einem Rechner)
> > und kein Internformat.
> >
> Auch richtig, ABER MAB und MARC wurden immer auch unreflektiert als Internformate
> eingesetzt, bis heute. Weil das mit XML auch passieren wird (bei TAMINO von
> Software-AG schon der Fall, und die prahlen sogar damit), deswegen sollte schon
> beim Grundansatz auf Vermeidung von wirklich unnuetzer Verschwendung geachtet
> werden. Wahrscheinlich ist der Zug aber schon wieder abgefahren.

Niemand hindert Sie daran, die Namen aus dem MARCXML-Namespace 
mit einem Standardwerkzeug Ihrer Wahl in einen geeigneteren 
Namespace (etwa Feldnamen rein aus den 243 aethiopischen
Einzelbuchstaben, was koennte effizienter sein) umzuwandeln. 
Das Zauberwort hier heisst XSLT: Sie definieren einfach 
(als XML-Dokument) eine Konkordanz zwischen den offiziellen 
Namen und Ihren Abkuerzungen, fertig. Auch hier ist wieder 
der Vorteil, dass Sie keine Konversionssoftware benoetigen, 
sondern nur ein Dokument, das die Zuordnung beschreibt.
Aber bitte werfen Sie das Dokument nie weg, denn sonst
muss Ihre Software neu programmiert werden, weil keiner
mehr rekonstruieren kann, was sie tut...

viele Gruesse
Thomas Berger



More information about the rak-list mailing list