AW: [datenformate] Nichtsortierzeichen bei Praefixen in Personennamen via RDF

Heuvelmann, Reinhold R.Heuvelmann at dnb.de
Tue May 13 15:08:17 CEST 2014


Lieber Herr Eversberg,
liebe Liste,

meine Antworten weiter unten im urspruenglichen Text

Viele Gruesse

Reinhold Heuvelmann

--

Reinhold Heuvelmann
Deutsche Nationalbibliothek
Arbeitsstelle Datenformate
Adickesallee 1
D-60322 Frankfurt am Main
Telefon: +49 (0) 69 1525-1709
Telefax: +49 (0) 69 1525-1799
mailto:r.heuvelmann at dnb.de
http://www.dnb.de

*** Lesen. Hören. Wissen. Deutsche Nationalbibliothek ***


-----Ursprüngliche Nachricht-----
Von: datenformate-bounces at lists.dnb.de [mailto:datenformate-bounces at lists.dnb.de] Im Auftrag von Bernhard Eversberg
Gesendet: Montag, 12. Mai 2014 17:36
An: Mailingliste Datenformate (frueher mab-list)
Betreff: Re: [datenformate] Nichtsortierzeichen bei Praefixen in Personennamen via RDF

Am 12.05.2014 15:33, schrieb Heuvelmann, Reinhold:

  <gndo:preferredNameForThePerson>Droste-Hülshoff, Annette 
von</gndo:preferredNameForThePerson>
  <gndo:preferredNameEntityForThePerson rdf:parseType="Resource">
  	<gndo:forename>Annette</gndo:forename>
  	<gndo:prefix>von</gndo:prefix>
  	<gndo:surname>Droste-Hülshoff</gndo:surname>
  </gndo:preferredNameEntityForThePerson>

Freilich, das ist beträchtlich aussagekräftiger als

100 Droste-Hülshoff, Annette$cvon

Fast 90% "more byte for the buck", wenn man's mal salopp sagen darf.

[DNB/rh]
Ja, viel Luft und Redundanz  ;-)   Man merkt, dass die Substanz dieselbe ist, wenn man Vergleichsdateien zippt -- sie sind dann aehnlich gross.  Ein Byte ist halt nicht mehr so kostbar wie noch vor 50 oder auch 20 Jahren.  Und der Maschine ist das meist egal.  Fuer die Lesbarkeit durch uns Menschen braucht man allerdings m.E. etwas Besseres als RDF in XML.


Zwei Fragen:

1. Warum mußte der ursprüngliche Namensraum gnd: nochmal umgetauft
    werden in gndo: ? (Habe keine Begründung gefunden, zugegeben)

[DNB/rh]
Das ist hier im Haus so vorgenommen worden, wie mir der Kollege Lars Svensson schreibt:

---schnipp---

Bei Darstellungen von GND-Daten in RDF haben wir oft das Präfix "gnd" für zwei verschiedene Namespaces verwendet: einerseits für Instanzdaten aus der GND (z. B. gnd:118527533 ist das Präfix http://d-nb.info/gnd/), andererseits für Klassen und Properties aus der GND-Ontologie (z. B. gnd:preferredNameForThePerson, wo das Präfix http://d-nb.info/standards/elementset/gnd# ist).

Wenn man z. B. aber Instanzdaten der GND mit der GNDO beschreiben will, braucht man zwei verschiedene Präfixe, denn

gnd:118527533 gnd:preferredNameForThePerson "Droste-Hülshoff, Annette von" .

ist nicht eindeutig. Deswegen haben wir für die GND-Ontologie das Präfix gndo eingeführt.

---schnapp---


2. Sehen Sie eine ähnlich granulare Darstellung auch im Bibframe-Projekt
    kommen? Oder wenigstens, daß LC endlich die in einem langen
    Geneseprozeß hervorgebrachten "non-sort markers" auch anwenden wird?
    Denn sonst wird's, realpolitisch gesehen, für die Katz gewesen sein,
    das ist sicher auch Ihnen längst klar.

[DNB/rh]
Immerhin koennen OCLC und andere Bezieher von MARC-Daten (darunter das ISSB-Center in Paris) unsere Form in die Indikator-Version umrechnen ... .

OCLC wird die Control Character sicher nicht zur Eingabe vorsehen, etwa im Connexion Client.

Der Mehrwert der Control Character gegenueber der Indikator-Version wird als nicht so hoch angesehen, dass der Aufwand, der mit einer Einfuehrung der Control Character verbunden waere, als gerechtfertigt angesehen wird.  So meine Wahrnehmung.  Also kurz:  Nein, die LC wird die Control Character nicht anwenden.

Wie in meiner vorherigen Nachricht geschrieben:  Immerhin hat MODS ein analoges Element "<nonSort>".

In BIBFRAME sehe ich einerseits die Moeglichkeit, die Sprache zu kennzeichnen und damit die Frage Artikel oder Nicht-Artikel besser entscheidbar zu machen.

Diskutieren kann und sollte man auch, ob die Sortierung von Trefferlisten in einer Linked-Data-Umgebung, also im WEB, noch Mittel der Wahl ist; und ob Benutzer einen Eintrag nicht vielleicht sogar unter dem Artikel erwarten wuerden.  Insgesamt habe ich, wenn ich das Thema angebracht habe, eher Reaktionen bekommen, die eine geringere Prioritaet signalisiert haben.  Fest steht da aber noch nichts.

Ganz fuer die Katz ist es nicht, da moechte ich widersprechen -- wir haben jedenfalls mit langem Atem signalisiert, dass uns das Thema nicht ganz unwichtig ist, und Sensibilitaet geschaffen, so dass auch in den RDA die einfache Auslassung der Artikel am Anfang (die in der deutschen Sprache unmoeglich ist) nur noch eine der moeglichen Vorgehensweisen ist.  Dazu das deutsche Proposal, erreichbar unter  http://www.rda-jsc.org/docs/6JSC-Chair-3.pdf , und alle Dokumente unter  http://www.rda-jsc.org/workingnew.html  mit der Zaehlung  "6JSC/Chair/3".


In den RDA-Testdaten der LC, die vor ein paar Jahren herauskamen, waren
noch keine ermutigenden Anzeichen zu entdecken.

[DNB/rh]
Wie gesagt, da kann ich mir keine Aenderung vorstellen.


B.Eversberg



B.Eversberg



_______________________________________________
datenformate mailing list
datenformate at lists.dnb.de
http://lists.dnb.de/mailman/listinfo/datenformate


More information about the datenformate mailing list