[mab-list] Anmerkungen zu MABxml

Jakob jakob.voss at s1999.tu-chemnitz.de
Tue Apr 13 15:51:05 CEST 2004


Hallo!

Ich habe mich erst jetzt näher mit MABxml beschäftigt und freue mich, dass die
Weiterverarbeitung von MAB-Datensätzen einen Schritt einfacher geworden ist -
wenn dann auch ein Skript für die Konvertierung von MAB nach MABxml
entsprechend den Übertragungsregeln vorliegt. [1]

Bei der Beschäftigung mit MABxml ist mir folgendes aufgefallen:

1.) Die Satztypen (Satzkennung) m und c sind im XML Schema bislang nicht
vorgesehen

2.) Das unter http://www.ddb.de/professionell/mabxml/BeispielEbene1.xml
angebotene Beispiel ist nicht valide! Zumindest sind XMLSpy und Xerces dieser
Meinung. Es klemmt bei Konstruktionen wie

<feld nr="331" ind=" "><ns>Die</ns> schöne Lau</feld>

aufgrund der Definition des Inhalts des Elementes "feld" mit Hilfe von

<xsd:group ref="basisElemente">

Wenn die Elemente tf, stw und ns direkt angegeben werden, gibt es kein Problem.
Übrigens könnte auf complexType auch ganz verzichtet werden, was das XML Schema
etwas verschlanken würde. [2]

3.) Ein leerer Indikator (blank) wird als <feld ind=" " ...> codiert. Da
Leerzeichen oft gesondert behandelt werden wäre es meiner Meinung nach
sinnvoller, stattdessen zu vereinbaren, dass das Attribut 'ind' optional und
auf die Zeichen a-z und 0-9 beschränkt ist. D.h. wenn der Indikator ein blank
ist, ist das Attribut 'ind' wegzulassen.

4.) Für den Unterfeld-code ist jedes beliebige Zeichen zulässig. Könnte man hier
nicht auch auf a-z und 0-9 beschränken?


Mit freundlichen Grüßen,
  Jakob Voß


[1] Das noch vor der Veröffentlichung von MABxml entstandene Skript
http://ibil1.ib.hu-berlin.de/~voj/files/mab2xml/info.txt
werde ich wahrscheinlich nicht zu Ende bringen, da mir hoffentlich die
Hauptberuflichen zuvorkommen werden. Ich würde es begrüssen, wenn
diesbezügliche Entwicklungen als Open Source veröffentlicht werden, um die
Weiterverwendung zu ermöglichen.

[2] Mir ist die Definition eines Feldinhalts noch nicht ganz klar. Welche der
folgenden Konstrukte sind erlaubt und welche nicht (hier ohne Attribute):

<feld>Bla</feld>                           - ja
<feld><ns>Bla</ns>Bla</feld>               - Mixed content (s.o.)
<feld><uf>Blabla</uf></feld>               - ja
<feld><uf>Blabla</uf><uf>Bla</uf></feld>   - mehrere Unterfelder?
<feld>Bla<uf>Bla</uf>Bla</feld>            - Unterfeld und Text gemischt?
<feld>Bla<uf>Bla</uf><stw>Bla</stw></feld> - Unterfeld, Text und Element

Im Übrigen bin ich der Meinung, dass XML Schema zu weiten Teilen Murks ist, aber
da kann man wohl nichts machen.


----------------------------------------------------------------------
Zum Austragen aus dieser Liste senden Sie bitte eine Mail an
majordomo at ddb.de mit unsubscribe mab-list im Textfeld.



More information about the datenformate mailing list