Antw: [gnd] Ergänzung von originalschriftlichen Ansetzungs- und Verweisungsformen aus dem SWB in der Ü-GND

Silke Tölle toelle at hbz-nrw.de
Mon Feb 4 15:43:01 CET 2013


Liebe Frau Katz, liebe Kolleginnen und Kollegen der DNB,
 
vielen Dank für die Information. 
 
Dazu zwei Anmerkungen: 
 
Wir haben die Sätze im Approval-System angesehen. Das sieht wirklich
gut aus. Bei mindestens zwei Sätze ist uns aber aufgefallen, dass Feld
7XX $v Original doppelt vergeben ist. Das sollte nur einmal vorkommen.
Evtl. sollte man das bei der Validation auch berücksichtigen. Mindestens
im Erfassungsleitfaden sollte es aber auch ergänzt werden. 
 
Bei der Einspielung der Teilmengen möchten wir darum bitten, dass die
Einspielung nicht zeitgleich zu einem Match- und Mergevorgang oder gar
zu einer TOP500-Zusammenführung erfolgt. Sie schreiben, dass der genaue
Einspieltermin ohnehin gemeinsam abgestimmt werden muss - dann müssen
wir diese Frage entsprechend berücksichtigen. 
 
Viele Grüße
 
Silke Tölle 


 
 
---
Silke Tölle
hbz - Hochschulbibliothekszentrum NRW
Datenbankservices und Verbunddienstleistungen
Postfach 27 04 51
50510 Koeln
Tel. +49-221-40075-119  
Fax +49-221-40075-169
toelle at hbz-nrw.de
www.hbz-nrw.de
 
---
>>> "Katz, Cornelia" <Cornelia.Katz at bsz-bw.de> 30.01.2013 12:39 >>>
Liebe Kolleginnen und Kollegen in der DNB und den Verbundsystemen,



im BSZ befinden wir uns nun in der Testphase für das Ergänzen unserer
originalschriftlichen Ansetzungs- und Verweisungsformen in der Ü-GND. 



Ich will an dieser Stelle kurz schildern, wie wir dies -
selbstverständlich nach durchgeführter Absprache mit der DNB -
durchführen. Wir gehen in folgenden Schritten vor:



1. Selektion der relevanten GND-Normdatensätze mit Originalschrift

2. Download über WinIBW im Erfassungsformat

3. Konvertierung (per Programm) der orginalschriftlichen Inhalte aus
den SWB-spezifischen Feldern in die Felder 4xx und 7xx, dabei werden
$5DE-576 und $vOriginal (in 7xx) ergänzt 

4. Erzeugung einer entsprechenden Datei als Input für das
WinIBW-Skript

5. Über ein im BSZ erstelltes WinIBW-Skript werden die in der Datei
enthaltenen Sätze gelesen, in der Ü-GND gesucht und im
"Bearbeiten-Modus" die originalschriftlichen Felder ergänzt.



Seit Montag testet Frau Scherer das Ergänzen der originalschriftlichen
Ansetzungs- und Verweisungsformen über unser WinIBW-Skript im
Approval-System der DNB. Die Einspielung erfolgt in Teilmengen. Die
Gesamtmenge bewegt sich zwischen 13.000 und 14.000 zu ergänzenden
Sätzen. Das Skript schafft ca. 1000 Sätze in 15 bis 20 Minuten.



Die bereits ergänzten Sätze können Sie anschauen. Über die WinIBW sind
diese mit der Suche "f aai de576" zu ermitteln.



Leider war es mit dem Schreiben des Konvertierungsprogramms und der
Erstellung des WinIBW-Skript nicht getan. Die Validation beim Eintragen
der Daten in den Ü-GND-Sätzen schlägt doch an einigen Stellen zu, sodass
Frau Scherer sowohl das Skript nachgebessert hat, als auch intellektuell
manuell bei einigen Datensätzen eingreifen muss, damit die Speicherung
erfolgen kann.

Hierzu einige Anmerkungen:



-    Bei den originalschriftlichen Feldern haben wir im SWB
grundsätzlich eine andere Validation, sodass im SWB
originalschriftliche Namensformen ohne Komma als Nachnamen gespeichert
werden konnten. In der Ü-GND kann man diese in den 400er-Feldern nur als
persönliche Namen abspeichern (also in $P), während man diese in den
700er-Feldern auch als Nachnamen (Belegung von Pica+ $a) abspeichern
kann (Beispiel: GND 174027214).
Bei arabischen Schriften kommt noch die Problematik hinzu, dass das
arabische Komma in der Pica3/Pica+-Konvertierung nicht als Komma erkannt
wird und somit dies auch ein persönlicher Name in Feld 400 validiert
wird (also $P erwartet wird), während in 700 die Speicherung als
Nachname erfolgt (Beispiel: GND 122408853).

Zumindest die unterschiedliche Validation sollte in der Ü-GND für die
Felder 400 und 700 noch bereinigt werden!

Wir im BSZ arbeiten derzeit die als Nachnamen gespeicherten
Ansetzungsformen in persönliche Namen um, indem $P belegt wird.  

-    Validationsmeldung bei Personen für fehlende
Individualsierungsmerkmale bei Eintrag Originalschrift. Taucht in
einigen, bisher wenigen, Fällen auf. Dazu ergänzt Frau Scherer parallel
im Approval und Produktionssystem die Merkmale (manuell, nach entspr.
Recherche). Wir gehen davon aus, dass der Zustand bis zu unserer
Einspielung so bleibt, bis die im Rahmen des letzten CJK-Workshops
besprochene Verfahrensweise, dass die Ergänzung der Originalschrift als
Individualisierungsmerkmal gilt, in der EG Normdaten bestätigt und von
der DNB entspr. umgesetzt wird. 



-    Validationsmeldung bei Tp-SE-Sätzen auf fehlenden Ländercode und
Quellenangabe. Diese ergänzt Frau Scherer parallel im Approval und
Produktionssystem (manuell, intellektuell)

-    Fehlende Ländercodes und Entitätencodes in älteren Tb-Sätzen
werden innerhalb des Skriptes ergänzt



-    Weitere Validationsfehler können sein: fehlendes $4 bei
5xx-Feldern, fehlendes $b bei 678, fehlerhafte LC-Aut-Eintragungen (s.
GND 118574647, sehr viele Zeilen zu korrigieren)



Fazit: bei diesem Verfahren gibt es unendlich viel zu korrigieren (auch
bedingt durch die Validation in der Ü-GND, die bei maschinell
eingespielten Sätzen und vor Jahren unter anderen Bedingungen angelegten
Sätzen, gnadenlos zuschlägt), damit die Sätze überhaupt gespeichert
werden können. 



Wir können uns hier im BSZ eine Übertragung der originalschriftlichen
Ansetzungs- und Verweisungsformen aus dem SWB in der zweiten
Februarhälfte vorstellen. Ein genauer Termin ist noch gemeinsam zu
bestimmen.



Für die Beantwortung von Fragen zum Verfahren stehen wir gern zur
Verfügung.



Viele Grüße

Cornelia Katz  







Cornelia Katz

Bibliotheksservice-Zentrum Baden-Wuerttemberg (BSZ)

78457 Konstanz / Germany

Phone: +49 7531 88 3189

E-Mail: cornelia.katz at bsz-bw.de

http://www.bsz-bw.de



-----Ursprüngliche Nachricht-----
Von: gnd-bounces at lists.d-nb.de [mailto:gnd-bounces at lists.d-nb.de] Im
Auftrag von Wiechmann, Brigitte
Gesendet: Mittwoch, 5. Dezember 2012 15:32
An: Diskussionsliste Gemeinsames Normdatenformat (gnd at lists.d-nb.de)
Betreff: [gnd] Originalschriftliche Eingabe in die GND



Liebe Kolleginnen und Kollegen,



inzwischen sind die technischen Voraussetzungen zur Eingabe von
Originalschrift in die GND-Datensätze getroffen worden.



Erste Einspielungen von Verbunddaten erfolgen nach dem 07.01.2013 nach
Absprache mit der DNB.

Wir möchten Sie bitten, manuelle Ergänzungen von originalschriftlichen
Feldern in vorhandene Datensätzen erst nach dem Einspielen der
Verbunddaten vorzunehmen.

Begründung: Derzeit läuft noch das automatische
Match-und-Merge-Verfahren, außerdem beginnt die Zusammenführung von viel
genutzten Geografika im Januar.



Wenn wir mit den manuellen Ergänzungen bis nach dem Einspielen der
Verbunddaten warten, wird vermieden, dass Datensätze mehrfach über den
Änderungsdienst ausgeliefert werden müssen und die Schnittstellen
belasten.



Neueingaben von Datensätzen mit originalschriftlichen Feldern sind kein
Problem und können jetzt schon gemacht werden, Ergänzungen insbesondere
von mit vielen Titeln verknüpften Personen oder Körperschaften dagegen
noch nicht.



Mit freundlichen Grüßen



Brigitte Wiechmann





***Lesen. Hören. Wissen. 100 Jahre Deutsche Nationalbibliothek***



Brigitte Wiechmann

Deutsche Nationalbibliothek

Arbeitsstelle für Standardisierung

Arbeitsstelle Normdateien

Adickesallee 1

D-60322 Frankfurt am Main

Tel: +49-69-15251488

Fax: -49-69-15251010

mailto:b.wiechmann at dnb.de <mailto:b.wiechmann at dnb.de> 

http://www.dnb.de<http://www.dnb.de/
<http://www.dnb.de%3chttp:/www.dnb.de/> >

http://www.dnb.de/100jahre <http://www.dnb.de/100jahre>