[Lds] Diakritische Sonderzeichen im RDF/XML

Michael Freiberg michael.freiberg at Staff.Uni-Marburg.DE
Fre Aug 5 14:11:18 CEST 2016


Liebe Liste,

ich wende mich mit einer weiteren Anfrage mit einer separaten Mail an Sie, um die Themen nicht miteinander zu vermengen. Beim Abruf der RDF/XML-Repräsentation des GND-Normdatensatzes von Albrecht Dürer ist mir aufgefallen, dass das 'ü' in der bevorzugten Namensansetzung eine Kombination aus Diakritikum und Buchstaben darstellt, hier also Trema + u.

Beim Stringmatching sind "Dürer, Albrecht" (Trema + u) und "Dürer, Albrecht" (ü) nicht identisch. Mich würde daher interessieren, wie die GND in dem Punkt Sonderzeichen vorgeht. Werden alle Buchstaben mit einem Diakritikum als kombinierte Zeichen gespeichert oder gibt es Ausnahmen? Kennt vielleicht jemand von Ihnen eine Möglichkeit, die kombinierten Zeichen auf das entsprechende UTF8-Einzelzeichen abzubilden?

Vielen Dank im Voraus für Antworten
und nochmals viele Grüße,

Michael Freiberg

--

Michael Freiberg

Bildarchiv Foto Marburg
Biegenstraße 11
35037 Marburg

Tel: +49 (0)6421 - 28 22435
Fax: +49 (0)6421 - 28 28931
E-Mail: michael.freiberg at fotomarburg.de