AW: [Lds] Diakritische Sonderzeichen im RDF/XML
Hentschke, Jana
J.Hentschke at dnb.de
Fre Aug 5 15:24:31 CEST 2016
Lieber Herr Freiberg, liebe Liste,
wir liefern derzeit die RDF-Daten (bzw. alle DNB-Datenlieferungen einheitlich) in UTF decomposed aus. Vgl. dazu den Ankündigungstext vom Januar 2012[1].
Beste Grüße von
Jana | Hentschke
[1] http://www.dnb.de/SharedDocs/Downloads/DE/DNB/service/rundschreibenUmstellungUTF8.pdf
*** Lesen. Hören. Wissen. Deutsche Nationalbibliothek ***
--
Jana Hentschke
Deutsche Nationalbibliothek
Informationsinfrastruktur
Adickesallee 1
60322 Frankfurt am Main
Telefon: +49 69 1525-1773
Telefax: +49 69 1525-1799
mailto:j.hentschke at dnb.de
http://www.dnb.de
> -----Ursprüngliche Nachricht-----
> Von: lds-bounces at lists.dnb.de [mailto:lds-bounces at lists.dnb.de] Im Auftrag von
> Michael Freiberg
> Gesendet: Freitag, 5. August 2016 14:11
> An: lds at lists.dnb.de
> Betreff: [Lds] Diakritische Sonderzeichen im RDF/XML
>
> Liebe Liste,
>
> ich wende mich mit einer weiteren Anfrage mit einer separaten Mail an Sie, um die
> Themen nicht miteinander zu vermengen. Beim Abruf der RDF/XML-Repräsentation des
> GND-Normdatensatzes von Albrecht Dürer ist mir aufgefallen, dass das 'ü' in der
> bevorzugten Namensansetzung eine Kombination aus Diakritikum und Buchstaben
> darstellt, hier also Trema + u.
>
> Beim Stringmatching sind "Dürer, Albrecht" (Trema + u) und "Dürer, Albrecht" (ü)
> nicht identisch. Mich würde daher interessieren, wie die GND in dem Punkt
> Sonderzeichen vorgeht. Werden alle Buchstaben mit einem Diakritikum als kombinierte
> Zeichen gespeichert oder gibt es Ausnahmen? Kennt vielleicht jemand von Ihnen eine
> Möglichkeit, die kombinierten Zeichen auf das entsprechende UTF8-Einzelzeichen
> abzubilden?
>
> Vielen Dank im Voraus für Antworten
> und nochmals viele Grüße,
>
> Michael Freiberg
>
> --
>
> Michael Freiberg
>
> Bildarchiv Foto Marburg
> Biegenstraße 11
> 35037 Marburg
>
> Tel: +49 (0)6421 - 28 22435
> Fax: +49 (0)6421 - 28 28931
> E-Mail: michael.freiberg at fotomarburg.de
>
>