AW: [Lds] Diakritische Sonderzeichen im RDF/XML

Klee, Carsten Carsten.Klee at sbb.spk-berlin.de
Fre Aug 5 14:18:08 CEST 2016


Lieber Herr Freiberg,

wir normalisieren die Daten bevor wir sie benutzen:

uconv -f utf-8 -t utf-8 -x nfc  1602_GND.ttl > 1602_NFC_GND.ttl

Besten Gruß,

Carsten Klee
_______________________________________________
Carsten Klee
Abt. Überregionale Bibliographische Dienste IIE
Staatsbibliothek zu Berlin – Preußischer Kulturbesitz
Potsdamer Straße 33
10785 Berlin

Fon:  +49 30 266-43 44 02
Fax:   +49 30 266-33 40 01
carsten.klee at sbb.spk-berlin.de
www.zeitschriftendatenbank.de


> -----Ursprüngliche Nachricht-----
> Von: lds-bounces at lists.dnb.de [mailto:lds-bounces at lists.dnb.de] Im
> Auftrag von Michael Freiberg
> Gesendet: Freitag, 5. August 2016 14:11
> An: lds at lists.dnb.de
> Betreff: [Lds] Diakritische Sonderzeichen im RDF/XML
> 
> Liebe Liste,
> 
> ich wende mich mit einer weiteren Anfrage mit einer separaten Mail an Sie,
> um die Themen nicht miteinander zu vermengen. Beim Abruf der RDF/XML-
> Repräsentation des GND-Normdatensatzes von Albrecht Dürer ist mir
> aufgefallen, dass das 'ü' in der bevorzugten Namensansetzung eine
> Kombination aus Diakritikum und Buchstaben darstellt, hier also Trema + u.
> 
> Beim Stringmatching sind "Dürer, Albrecht" (Trema + u) und "Dürer,
> Albrecht" (ü) nicht identisch. Mich würde daher interessieren, wie die GND in
> dem Punkt Sonderzeichen vorgeht. Werden alle Buchstaben mit einem
> Diakritikum als kombinierte Zeichen gespeichert oder gibt es Ausnahmen?
> Kennt vielleicht jemand von Ihnen eine Möglichkeit, die kombinierten
> Zeichen auf das entsprechende UTF8-Einzelzeichen abzubilden?
> 
> Vielen Dank im Voraus für Antworten
> und nochmals viele Grüße,
> 
> Michael Freiberg
> 
> --
> 
> Michael Freiberg
> 
> Bildarchiv Foto Marburg
> Biegenstraße 11
> 35037 Marburg
> 
> Tel: +49 (0)6421 - 28 22435
> Fax: +49 (0)6421 - 28 28931
> E-Mail: michael.freiberg at fotomarburg.de
> 
>