[Lds] Diakritische Sonderzeichen im RDF/XML
Michael Freiberg
michael.freiberg at Staff.Uni-Marburg.DE
Fre Aug 5 14:11:18 CEST 2016
Liebe Liste,
ich wende mich mit einer weiteren Anfrage mit einer separaten Mail an Sie, um die Themen nicht miteinander zu vermengen. Beim Abruf der RDF/XML-Repräsentation des GND-Normdatensatzes von Albrecht Dürer ist mir aufgefallen, dass das 'ü' in der bevorzugten Namensansetzung eine Kombination aus Diakritikum und Buchstaben darstellt, hier also Trema + u.
Beim Stringmatching sind "Dürer, Albrecht" (Trema + u) und "Dürer, Albrecht" (ü) nicht identisch. Mich würde daher interessieren, wie die GND in dem Punkt Sonderzeichen vorgeht. Werden alle Buchstaben mit einem Diakritikum als kombinierte Zeichen gespeichert oder gibt es Ausnahmen? Kennt vielleicht jemand von Ihnen eine Möglichkeit, die kombinierten Zeichen auf das entsprechende UTF8-Einzelzeichen abzubilden?
Vielen Dank im Voraus für Antworten
und nochmals viele Grüße,
Michael Freiberg
--
Michael Freiberg
Bildarchiv Foto Marburg
Biegenstraße 11
35037 Marburg
Tel: +49 (0)6421 - 28 22435
Fax: +49 (0)6421 - 28 28931
E-Mail: michael.freiberg at fotomarburg.de