[mab-list] AW: MabxmlTools

Heuvelmann, Reinhold heuvelmann at dbf.ddb.de
Mon May 17 11:13:40 CEST 2004


Lieber Herr Berger, liebe Liste,

Herr Kett schrieb:
> > Enthalten ist auch ein Tool zur Konversion vom Mab2-Zeichensatz
> > (x-MAB) nach UTF-8. Die Konversion basiert auf der hervorragenden 
> > Tabelle von Herrn Berger
> > (http://www.gymel.com/charsets/MAB2.html).

Herr Berger schrieb dazu:
> ... in der ich hoffentlich exakt die von Herrn Heuvelmann redaktionell
> betreute offizielle Konkordanz unter
> < http://www.ddb.de/professionell/pdf/mab_unic.pdf > abbilde (Sonst
> bitte schnell Bescheid sagen)...

Meine Anmerkung dazu:
Die "Zeichenkonkordanz MAB2-Zeichensatz - Unicode / ISO 10646" unter
http://www.ddb.de/professionell/pdf/mab_unic.pdf bildet nur die im
MAB-Zeichensatz vorhandenen Einzelzeichen (sowohl Grundbuchstaben
als auch Diakritika) auf Unicode / ISO 10646 ab. Ihre "Zeichentabelle
MAB2 (ISO 5426-1983)" enthaelt darueber hinaus auch noch die vielen
in Unicode / ISO 10646 fertig kombinierten Zeichen - Ergebnis einer
Bemuehung, die wir sehr anerkennen. Die kombinierten Zeichen sind
mit Hilfe von Angaben in Unicode ableitbar aus meiner Tabelle, was
wir aber nicht im Detail geprueft haben.


Herr Kett schrieb weiter:
> > Es gibt allerdings zwei wichtige Abweichungen, für die ich mich
> > nach einer Empfehlung des Kollegen R. Heuvelmann entschiedenen habe:
> > Das Nicht-Sortier-Beginn- (x-MAB 88) und 
> > Nicht-Sortier-Ende-Zeichen (x-MAB 89)
> > wird anders als in der Tabelle folgendermaßen  abgebildet:
> > 	
> > 	x-MAB 88 --> Unicode 0098
> > 	x-MAB 89 --> Unicode 009C

Herr Berger schrieb dazu:
> also kompatibel zum Mapping von ANSEL <-> Unicode.

Meine Anmerkung dazu:
Genau. Dieses Mapping ist z.B. unter
http://lcweb2.loc.gov/cocoon/codetables/1.html
erreichbar, wobei der zweite Teil "Code Table Extended Latin (ANSEL)"
hier relevant ist.

Herr Berger schrieb weiter:
> Bedeutet diese Abweichung gleichzeitig ein "heimliches" Update der
> Konkordanz MAB <-> Unicode?

Nicht unbedingt ein heimliches, aber ein abgesprochen-vorweggenommenes.
Ich werde mich im Sommer, wenn die Entscheidung zum Umlaut-Trema-Problem
in Unicode / ISO 10646 klarer ist, im Zusammenhang an eine Ueberarbeitung
der Zeichenkonkordanz machen.

Beste Gruesse

Reinhold Heuvelmann


Reinhold Heuvelmann
Die Deutsche Bibliothek
Deutsche Bibliothek Frankfurt am Main
Informationstechnik / Format MAB
Adickesallee 1
D-60322 Frankfurt am Main
Telefon: +49-69-1525-1709
Telefax: +49-69-1525-1799
mailto:heuvelmann at dbf.ddb.de
http://www.ddb.de


----------------------------------------------------------------------
Zum Austragen aus dieser Liste senden Sie bitte eine Mail an
majordomo at ddb.de mit unsubscribe mab-list im Textfeld.



More information about the datenformate mailing list