(Fwd) Re: [rak-list] (Fwd) Standard XML schema for MARC 21

Thomas Berger ThB at gymel.com
Thu Jun 6 10:15:35 CEST 2002


Lieber Herr Eversberg,

> Nochmal:
> Wo das alte MARC dieses hat:
> 
> 260   $aNew York$bH. Holt$cc1988

Hm. Das ist aber doch schon bereits eine "Sicht" der
Dinge, naemlich fuer den Katalogisierer? Im Gegensatz
zu MAB ist MARC ja stets ein ISO-Format mit Directory
geblieben, d.h. den Bezug zwischen Feldern und Feldinhalten
kann man nur durch maschinelle Vorverarbeitung 
sichtbar machen.

> da sieht es mit XML so aus:
> 
> <datafield tag="260" ind1="" ind2="">
> <subfield code="a">New York :</subfield>
> <subfield code="b">H. Holt,</subfield>
> <subfield code="c">c1988.</subfield>
> </datafield>
> 
> K. Skalweit schreibt:
> > Und wieder stehe ich ratlos da und kann nicht
> > erkennen, was eine derartige XML-Struktur fuer
> > Vorteile bringen soll.
> Der Vorteil ist, dass Leute, die XML koennen, damit was machen koennen bzw. Daten
> in diese Form bringen koennen. Das alte MARC ist im Vergleich hoechst esoterisch.

Offensichtliche Vorteile sind:

- Man kann die Daten ohne Vorverarbeitung lesen
- Man kann die Daten uebermitteln (etwa per e-mail) ohne sich
  ueber Leitungsverluste wie Veraenderung von Spatien oder 
  Steuerzeichen Sorgen zu machen [nicht ganz: Es gibt einige
  Stellen in den AACR, die die Eingabe von Doppel- bzw.
  Dreifachspatien erfordern, bezeichnenderweise sind in den AACR 
  selbst (2nd Edition 1998) die Beispiele hierzu bis zur
  Unkenntlichkeit entgleist]
- Uebermittelt man die Daten komprimiert, wie man es bislang
  meistens tun musste, ist die Redundanz kein Problem
- Systemadministratoren werden mit Standardwerkzeugen einfache
  Standardanfragen beantworten koennen (etwa: "Gib mir alle
  Datensaetze mit 'New York' in field 260")
- Daten koennen auch offline erfasst und auf Konformitaet
  geprueft werden (eine MARC DTD gibt es ja auch seit
  laengerem, die Ankuendigung der LC bezog sich auf
  das MARC Schema)
- Man kann auch ein "$" aus der Vorlage katalogisieren
- Man kann sie (durch Einrueckungen und Umbrueche) noch
  lesbarer gestalten, ohne die Bedeutung oder Verarbeitbarkeit
  zu beeintraechtigen
- Durch geeignete Forformatierung bekommt man alleine durch
  weglassen der Tags (was ein HTML-Browser bei unbekannten
  Elementen sowieso tut) fast eine ISBD-Anzeige
- Durch jeweils (weltweit!) ein Stylesheet wird man solche Records
  in Kurzdarstellungen, ISBD-Darstellungen und was auch immer
  umwandeln koennen, und das ohne Bibliothekssystem: In nicht
  allzu ferner Zukunft denkbar ist also, einen recherchierenden
  Benutzer aus dem OPAC mit XML-Records zu versorgen, sein
  Webbrowser uebernimmt dann das Sortieren, Filtern und Anzeigen

> Der Verlust an verarbeitungstechnischer Effizienz ist zwar gewaltig, wird jedoch
> sehr vermutlich ignoriert oder in Kauf genommen werden. Bis jedoch alle die

Ich sehe nicht, wieso hoehere Redundanz (= Verlust an Entropie)
einen Verlust an "verarbeitungstechnischer Effizienz" bedeuten
sollte. XML ist "verarbeitungstechnisch" effizienter, weil
in groesserem Umfang Standardwerkzeuge zur Verarbeitung eingesetzt 
werden koennen und weil auf Veraenderungen eher auf der Ebene
des "Umschreibens eines Beschreibungstexts" reagiert werden kann
als durch "Umprogrammierung" (schlimmstenfalls durch den 
Softwarelieferanten). "Effizienz" ist zudem heutzutage eher
etwas, das in Ersparnis von Mitarbeiterstunden gemessen wird 
und nicht in Festplattenplatz.


> Verfahren und Programme, die jetzt mit MARC21 umgehen, auf XML umgestellt sind,
> wird noch viel Zeit vergehen, denn eine Umstellung laufender Dinge auf XML ist
> nichts anderes als eine Neuprogrammierung, und keine ganz einfache.

Zunaechst einmal ist es fuer real existierende Programme nur 
die Erstellung von Import- und Exportfiltern (die auch als
externe Programme zur Vor- bzw. Nachbearbeitung realisiert
werden koennen). Denn auch fuer XML gilt das, was fuer MAB und
MARC gesagt wurde: Es ist vornehmlich ein Austauschformat
fuer Daten (etwa auch zwischen Anwendungen auf einem Rechner)
und kein Internformat.

viele Gruesse
Thomas Berger



More information about the rak-list mailing list