[gnd] Re: [eg-normdaten] Dateneinspielungen in die GND - Bedarfserhebung

Monika Denker M.Denker at ub.uni-frankfurt.de
Die Jul 10 12:03:09 CEST 2012


Liebe Kolleginnen und Kollegen,

das Einspielen einer derart großen Menge von Normdatensätzen in die GND 
wirft, insbes. angesichts der vorliegenden Erfahrungen mit den zuletzt 
hinzugekommenen Sätzen mit Level 6, einige Fragen auf:
.    Wie kann ein Standard zum Abgleich der einzuspielenden Daten mit 
der GND aussehen, der gewährleistet, dass die ohnehin schon vorhandene 
Menge an Dubletten nicht in großem Umfang ausgeweitet wird?
Dies dürfte gerade für Personennamen, die keine wirklichen 
Individualisierungsmerkmale führen, ein Problem sein!
.    Welchen Gewinn stellen die qualitativ eher niedrig einzuschätzenden 
Tp-Sätze für die GND und deren Nutzer dar? Faktisch handelt es sich 
vermutlich zum allergrößten Teil um Personensätze, die in keiner Weise 
der Individualisierungsrichtlinie entsprechen und die, wenn überhaupt, 
nur über eine vorhandene abweichende Namensform gekennzeichnet sind. 
Andere Verbünde würden diese Daten als nichtindividualisierte 
Personensätze (Tn) behandeln.

Angesichts dieser Einschätzung kommen wir zu dem Ergebnis:
.    Es spricht natürlich überhaupt nichts gegen eine Online-Erfassung 
kleinerer Datenmengen  per WinIBW. Hierbei können die verabredeten 
Standards zum Abgleich und der Individualisierung eingehalten werden.
.    Wenn jedoch größere Datenmengen offline eingespielt werden sollten, 
müssten diese ggf. nach einem Dubl.-Check als Tn-Sätze (keine 
Individualisierungsmerkmale vorh.) bzw. als Tp-
Sätze mit Level 6 (Merkmale vorh., aber nicht ausreichend) behandelt werden.
Mit der im GBV verfolgten abweichenden Regel, immer schon dann zu 
individualiseren, wenn eine abweichende Namensform vorliegt, werden 
Tp-Sätze erzeugt, die nicht den GND-Regeln entsprechen.
HeBIS würde sich vorbehalten, diese Datensätze nicht in die eigene 
GND-Datenbank zu übernehmen.
Als Empfehlung zur Katalogisierung in GND müsste die Devise gelten, 
Tp-Sätze ohne ausreichende Merkmale werden ggf. "hochkatalogisiert" oder 
aber ignoriert, falls unbrauchbare Informationen (Wirkungsjahre oder 
Verweisungsformen) keine Nutzung erlauben.
Grundsätzlich sollte ein übergeordnetes Steurungsgremium entscheiden, 
inwieweit das Ausdehnen der GND "um jeden Preis" (nicht mehr 
kontrollierbare Dublettenmengen) vorangetrieben werden soll. Das 
Aufblähen der GND mit Tp-Sätzen, die nur einen minimalen 
Identifizierungsgrad besitzen, sowie mit großen Mengen an Dubletten 
scheint uns keine benutzerfreundliche Perspektive zu sein. Die 
Expertengruppe darf u.M.n. nicht über derlei strategische Fragen 
hinwegsehen und einfach nur die technische Abwicklung großer Datenflüsse 
betreiben.

HeBIS hat keine Altdaten mehr zu liefern, möchte aber so bald wie 
möglich (wie der SWB auch) Originalschrift zu vorhandenen 
GND-Datensätzen nachliefern. Hierfür sollte ein Konzept (Abläufe, 
Dublettencheck etc.) unter den Originalschriftlieferanten abgesprochen 
werden.

Viele Grüße aus der HeBIS-VZ,
Monika Denker



Am 02.07.2012 12:00, schrieb Pfeifer, Barbara:
> Liebe Kolleginnen und Kollegen,
> der Alltag in der Normdatenarbeit kehrt langsam wieder ein und wir 
> möchten das Thema Dateneinspielungen in die GND aufgreifen, auf das 
> wir in den letzten Wochen angesprochen wurden.
> Der GBV möchte gerne ca. 700.000 verbundinterne Normdatensätze der 
> Satzart Tp in die überregionale GND einspielen. Die Datensätze stammen 
> aus unterschiedlichen Bibliotheken; die Kontingente umfassen zwischen 
> über 200.000 Datensätze bis zu unter 100 Datensätzen.
> Mit dieser Mail möchten wir den Bedarf aus anderen Verbünden 
> ermitteln. Wenn wir diesen zusammengestellt haben und die Größe der 
> Kontingente wissen, benötigen wir Ihre Zustimmung dazu bzw. eine 
> Aussage dazu, ob Sie diese Datenmengen in Ihrem Verbund einspielen können.
> Hier eine grobe Skizze des möglichen Ablaufs:
>
>   * Datenabgleiche zur überregionalen GND sollen vom Verbund vorab
>     selbst durchgeführt werden.
>
>   * Kleine Datenmengen können unter "Moderation" der DNB per
>     WINIBW-Skript sukzessive in kleinen Mengen in die GND im
>     Online-Betrieb vom Anwender selbst eingespielt werden.
>
>   * Größere Datenmengen werden von DNB maschinell eingespielt und über
>     die halbjährlichen Grundbestände den Partnern zur Verfügung
>     gestellt. Frühester Zeitpunkt dazu ist Frühjahr 2013.
>
>   * Die Selektion der Daten wird über Identifikationsnummernbereiche
>     möglich sein.
>
>   * Vorab sollten Testdaten an die DNB geliefert werden
>
> Bitte teilen Sie uns bis zum 13. Juli 2012 mit, ob aus Ihrem Verbund 
> auch noch Datenkontingente auf die Einspielung in die GND warten.
> Herzliche Grüße Brigitte Wiechmann und Barbara Pfeifer
> -- 
> Barbara Pfeifer
> Deutsche Nationalbibliothek
> Arbeitsstelle für Standardisierung
> Personennamendatei (PND)
> Adickesallee 1
> D-60322 Frankfurt am Main
> Telefon: +49-69-1525-1403
> Telefax: +49-69-1525-1010
> mailto:b.pfeifer at dnb.de
> http://www.dnb.de
>
>
> _______________________________________________
> eg-normdaten mailing list
> eg-normdaten at lists.d-nb.de
> http://lists.d-nb.de/mailman/listinfo/eg-normdaten