AW: [Lds] Diakritische Sonderzeichen im RDF/XML
Klee, Carsten
Carsten.Klee at sbb.spk-berlin.de
Fre Aug 5 14:18:08 CEST 2016
Lieber Herr Freiberg,
wir normalisieren die Daten bevor wir sie benutzen:
uconv -f utf-8 -t utf-8 -x nfc 1602_GND.ttl > 1602_NFC_GND.ttl
Besten Gruß,
Carsten Klee
_______________________________________________
Carsten Klee
Abt. Überregionale Bibliographische Dienste IIE
Staatsbibliothek zu Berlin – Preußischer Kulturbesitz
Potsdamer Straße 33
10785 Berlin
Fon: +49 30 266-43 44 02
Fax: +49 30 266-33 40 01
carsten.klee at sbb.spk-berlin.de
www.zeitschriftendatenbank.de
> -----Ursprüngliche Nachricht-----
> Von: lds-bounces at lists.dnb.de [mailto:lds-bounces at lists.dnb.de] Im
> Auftrag von Michael Freiberg
> Gesendet: Freitag, 5. August 2016 14:11
> An: lds at lists.dnb.de
> Betreff: [Lds] Diakritische Sonderzeichen im RDF/XML
>
> Liebe Liste,
>
> ich wende mich mit einer weiteren Anfrage mit einer separaten Mail an Sie,
> um die Themen nicht miteinander zu vermengen. Beim Abruf der RDF/XML-
> Repräsentation des GND-Normdatensatzes von Albrecht Dürer ist mir
> aufgefallen, dass das 'ü' in der bevorzugten Namensansetzung eine
> Kombination aus Diakritikum und Buchstaben darstellt, hier also Trema + u.
>
> Beim Stringmatching sind "Dürer, Albrecht" (Trema + u) und "Dürer,
> Albrecht" (ü) nicht identisch. Mich würde daher interessieren, wie die GND in
> dem Punkt Sonderzeichen vorgeht. Werden alle Buchstaben mit einem
> Diakritikum als kombinierte Zeichen gespeichert oder gibt es Ausnahmen?
> Kennt vielleicht jemand von Ihnen eine Möglichkeit, die kombinierten
> Zeichen auf das entsprechende UTF8-Einzelzeichen abzubilden?
>
> Vielen Dank im Voraus für Antworten
> und nochmals viele Grüße,
>
> Michael Freiberg
>
> --
>
> Michael Freiberg
>
> Bildarchiv Foto Marburg
> Biegenstraße 11
> 35037 Marburg
>
> Tel: +49 (0)6421 - 28 22435
> Fax: +49 (0)6421 - 28 28931
> E-Mail: michael.freiberg at fotomarburg.de
>
>