Antw: [gnd] Ergänzung von originalschriftlichen Ansetzungs- und Verweisungsformen aus dem SWB in der Ü-GND

Monika Denker M.Denker at ub.uni-frankfurt.de
Mon Feb 11 14:45:59 CET 2013


Liebe Frau Katz, liebe Kolleginnen,

vielen Dank für die Berichterstattung über den Fortgang der Tests 
bezügl. der Ori-Schrift. Wir lesen dies interessiert mit und würden uns 
gerne mit gleichem Verfahren anschliessen.
Es wundert nicht, dass der Weg per Skript im Onlineverfahren teilw. 
recht unbequem wird, da wir hinreichend Erfahrungen mit scharfer 
Validation haben. Dies wäre für uns durchaus ein Grund für ein Merging 
über Offline-Schnittstelle gewesen. Da unsere Datenmenge jedoch kleiner 
ist als die des SWB, wollen wir nicht schon vorab klagen.;-)

Nun noch eine Frage zur Belegung von $5: hierzu gibt es doch keine 
verbindliche Verabredung? Hat der SWB interne Gründe für dessen 
Besetzung(Index) ?
Wir hatten nicht vor, dieses Subf. zu belegen. Wir können und wollen 
doch sicher künftig nicht die Urheber einz. Ori-Schriften festhalten, 
schon garnicht in 4XX?
Sollte es zu Divergenzen bei der Vorzugsbenennung kommen, sollte u.M.n. 
die betr. Sprachredaktion entscheiden.

Viele Grüße
Monika Denker

Am 04.02.2013 16:01, schrieb Katz, Cornelia:
> Liebe Frau Tölle,
>
> vielen Dank für die positive Rückmeldung!
>
> Doppelte Eintragungen in 7xx kamen durch unser Skript leider unbeabsichtigter Weise zustande (ist mir auch am Mittwoch aufgefallen), wenn im Approvalsystem nicht alle Sätze enthalten waren. Dann wurde im gerade bearbeiteten Satz nochmal ein bisschen etwas ergänzt. Im Produktionssystem kann das nicht vorkommen. Hier ein Beispiel:
>
>   
>
> 005 Tp3
>
> 006 http://d-nb.info/gnd/1027432522
>
> 008 piz
>
> 011 f
>
> 035 gnd/1027432522
>
> 043 ZZ
>
> 100 Hisada, Masayoshi
>
> 400 $PHisada Masayoshi
>
> 400 $T01$UJpan%%$P????$5DE-576
>
> 400 $T01$UJpan%%$P????$5DE-576
>
> 548 1967$4datl
>
> 551 Setagaya-ku$4ortg
>
> 692 Genpatsu autoro- seishun hakusho. - 2012
>
> 700 $T01$UJpan%%??, ??$5DE-576$vOriginal
>
> 700 $T01$UJpan%%??, ??$5DE-576$vOriginal
>
> 903 $eDE-15
>
> 903 $rDE-576
>
>   
>
> Es sollte nur noch in Einzelfällen vorkommen, dass 2 700er mit $vOriginal belegt sind.
>
>   
>
> Viele Grüße
>
> Cornelia Katz
>
>   
>
>   
>
> Cornelia Katz
>
> Bibliotheksservice-Zentrum Baden-Wuerttemberg (BSZ)
>
> 78457 Konstanz / Germany
>
> Phone: +49 7531 88 3189
>
> E-Mail: cornelia.katz at bsz-bw.de
>
> http://www.bsz-bw.de
>
>   
>
>   
>
> -----Ursprüngliche Nachricht-----
> Von: gnd-bounces at lists.d-nb.de [mailto:gnd-bounces at lists.d-nb.de] Im Auftrag von Silke Tölle
> Gesendet: Montag, 4. Februar 2013 15:43
> An: Diskussionsliste Gemeinsames Normdatenformat
> Betreff: Antw: [gnd] Ergänzung von originalschriftlichen Ansetzungs- und Verweisungsformen aus dem SWB in der Ü-GND
>
>   
>
> Liebe Frau Katz, liebe Kolleginnen und Kollegen der DNB,
>
> vielen Dank für die Information.
>
>   
>
> Dazu zwei Anmerkungen:
>
>   
>
> Wir haben die Sätze im Approval-System angesehen. Das sieht wirklich gut aus. Bei mindestens zwei Sätze ist uns aber aufgefallen, dass Feld 7XX $v Original doppelt vergeben ist. Das sollte nur einmal vorkommen.
>
> Evtl. sollte man das bei der Validation auch berücksichtigen. Mindestens im Erfassungsleitfaden sollte es aber auch ergänzt werden.
>
>   
>
> Bei der Einspielung der Teilmengen möchten wir darum bitten, dass die Einspielung nicht zeitgleich zu einem Match- und Mergevorgang oder gar zu einer TOP500-Zusammenführung erfolgt. Sie schreiben, dass der genaue Einspieltermin ohnehin gemeinsam abgestimmt werden muss - dann müssen wir diese Frage entsprechend berücksichtigen.
>
>   
>
> Viele Grüße
>
> Silke Tölle
>
>   
>
>   
>
>   
>
> ---
>
> Silke Tölle
>
> hbz - Hochschulbibliothekszentrum NRW
>
> Datenbankservices und Verbunddienstleistungen Postfach 27 04 51 50510 Koeln Tel. +49-221-40075-119 Fax +49-221-40075-169 toelle at hbz-nrw.de <mailto:toelle at hbz-nrw.de>  www.hbz-nrw.de <http://www.hbz-nrw.de>
>
> ---
>
>>>> "Katz, Cornelia" <Cornelia.Katz at bsz-bw.de <mailto:Cornelia.Katz at bsz-bw.de> > 30.01.2013 12:39 >>>
> Liebe Kolleginnen und Kollegen in der DNB und den Verbundsystemen,
>
>   
>
>   
>
>   
>
> im BSZ befinden wir uns nun in der Testphase für das Ergänzen unserer originalschriftlichen Ansetzungs- und Verweisungsformen in der Ü-GND.
>
>   
>
>   
>
>   
>
> Ich will an dieser Stelle kurz schildern, wie wir dies - selbstverständlich nach durchgeführter Absprache mit der DNB - durchführen. Wir gehen in folgenden Schritten vor:
>
>   
>
>   
>
>   
>
> 1. Selektion der relevanten GND-Normdatensätze mit Originalschrift
>
>   
>
> 2. Download über WinIBW im Erfassungsformat
>
>   
>
> 3. Konvertierung (per Programm) der orginalschriftlichen Inhalte aus den SWB-spezifischen Feldern in die Felder 4xx und 7xx, dabei werden
>
> $5DE-576 und $vOriginal (in 7xx) ergänzt
>
>   
>
> 4. Erzeugung einer entsprechenden Datei als Input für das WinIBW-Skript
>
>   
>
> 5. Über ein im BSZ erstelltes WinIBW-Skript werden die in der Datei enthaltenen Sätze gelesen, in der Ü-GND gesucht und im "Bearbeiten-Modus" die originalschriftlichen Felder ergänzt.
>
>   
>
>   
>
>   
>
> Seit Montag testet Frau Scherer das Ergänzen der originalschriftlichen
>
> Ansetzungs- und Verweisungsformen über unser WinIBW-Skript im Approval-System der DNB. Die Einspielung erfolgt in Teilmengen. Die Gesamtmenge bewegt sich zwischen 13.000 und 14.000 zu ergänzenden Sätzen. Das Skript schafft ca. 1000 Sätze in 15 bis 20 Minuten.
>
>   
>
>   
>
>   
>
> Die bereits ergänzten Sätze können Sie anschauen. Über die WinIBW sind diese mit der Suche "f aai de576" zu ermitteln.
>
>   
>
>   
>
>   
>
> Leider war es mit dem Schreiben des Konvertierungsprogramms und der Erstellung des WinIBW-Skript nicht getan. Die Validation beim Eintragen der Daten in den Ü-GND-Sätzen schlägt doch an einigen Stellen zu, sodass Frau Scherer sowohl das Skript nachgebessert hat, als auch intellektuell manuell bei einigen Datensätzen eingreifen muss, damit die Speicherung erfolgen kann.
>
>   
>
> Hierzu einige Anmerkungen:
>
>   
>
>   
>
>   
>
> -    Bei den originalschriftlichen Feldern haben wir im SWB
>
> grundsätzlich eine andere Validation, sodass im SWB originalschriftliche Namensformen ohne Komma als Nachnamen gespeichert werden konnten. In der Ü-GND kann man diese in den 400er-Feldern nur als persönliche Namen abspeichern (also in $P), während man diese in den 700er-Feldern auch als Nachnamen (Belegung von Pica+ $a) abspeichern kann (Beispiel: GND 174027214).
>
> Bei arabischen Schriften kommt noch die Problematik hinzu, dass das arabische Komma in der Pica3/Pica+-Konvertierung nicht als Komma erkannt wird und somit dies auch ein persönlicher Name in Feld 400 validiert wird (also $P erwartet wird), während in 700 die Speicherung als Nachname erfolgt (Beispiel: GND 122408853).
>
>   
>
> Zumindest die unterschiedliche Validation sollte in der Ü-GND für die Felder 400 und 700 noch bereinigt werden!
>
>   
>
> Wir im BSZ arbeiten derzeit die als Nachnamen gespeicherten Ansetzungsformen in persönliche Namen um, indem $P belegt wird.
>
>   
>
> -    Validationsmeldung bei Personen für fehlende
>
> Individualsierungsmerkmale bei Eintrag Originalschrift. Taucht in einigen, bisher wenigen, Fällen auf. Dazu ergänzt Frau Scherer parallel im Approval und Produktionssystem die Merkmale (manuell, nach entspr.
>
> Recherche). Wir gehen davon aus, dass der Zustand bis zu unserer Einspielung so bleibt, bis die im Rahmen des letzten CJK-Workshops besprochene Verfahrensweise, dass die Ergänzung der Originalschrift als Individualisierungsmerkmal gilt, in der EG Normdaten bestätigt und von der DNB entspr. umgesetzt wird.
>
>   
>
>   
>
>   
>
> -    Validationsmeldung bei Tp-SE-Sätzen auf fehlenden Ländercode und
>
> Quellenangabe. Diese ergänzt Frau Scherer parallel im Approval und Produktionssystem (manuell, intellektuell)
>
>   
>
> -    Fehlende Ländercodes und Entitätencodes in älteren Tb-Sätzen
>
> werden innerhalb des Skriptes ergänzt
>
>   
>
>   
>
>   
>
> -    Weitere Validationsfehler können sein: fehlendes $4 bei
>
> 5xx-Feldern, fehlendes $b bei 678, fehlerhafte LC-Aut-Eintragungen (s.
>
> GND 118574647, sehr viele Zeilen zu korrigieren)
>
>   
>
>   
>
>   
>
> Fazit: bei diesem Verfahren gibt es unendlich viel zu korrigieren (auch bedingt durch die Validation in der Ü-GND, die bei maschinell eingespielten Sätzen und vor Jahren unter anderen Bedingungen angelegten Sätzen, gnadenlos zuschlägt), damit die Sätze überhaupt gespeichert werden können.
>
>   
>
>   
>
>   
>
> Wir können uns hier im BSZ eine Übertragung der originalschriftlichen
>
> Ansetzungs- und Verweisungsformen aus dem SWB in der zweiten Februarhälfte vorstellen. Ein genauer Termin ist noch gemeinsam zu bestimmen.
>
>   
>
>   
>
>   
>
> Für die Beantwortung von Fragen zum Verfahren stehen wir gern zur Verfügung.
>
>   
>
>   
>
>   
>
> Viele Grüße
>
>   
>
> Cornelia Katz
>
>   
>
>   
>
>   
>
>   
>
>   
>
>   
>
>   
>
> Cornelia Katz
>
>   
>
> Bibliotheksservice-Zentrum Baden-Wuerttemberg (BSZ)
>
>   
>
> 78457 Konstanz / Germany
>
>   
>
> Phone: +49 7531 88 3189
>
>   
>
> E-Mail: cornelia.katz at bsz-bw.de <mailto:cornelia.katz at bsz-bw.de>
>
>   
>
> http://www.bsz-bw.de <http://www.bsz-bw.de>
>
>   
>
>   
>
>   
>
> -----Ursprüngliche Nachricht-----
>
> Von: gnd-bounces at lists.d-nb.de <mailto:gnd-bounces at lists.d-nb.de>  [mailto:gnd-bounces at lists.d-nb.de <mailto:gnd-bounces at lists.d-nb.de> ] Im Auftrag von Wiechmann, Brigitte
>
> Gesendet: Mittwoch, 5. Dezember 2012 15:32
>
> An: Diskussionsliste Gemeinsames Normdatenformat (gnd at lists.d-nb.de <mailto:gnd at lists.d-nb.de> )
>
> Betreff: [gnd] Originalschriftliche Eingabe in die GND
>
>   
>
>   
>
>   
>
> Liebe Kolleginnen und Kollegen,
>
>   
>
>   
>
>   
>
> inzwischen sind die technischen Voraussetzungen zur Eingabe von Originalschrift in die GND-Datensätze getroffen worden.
>
>   
>
>   
>
>   
>
> Erste Einspielungen von Verbunddaten erfolgen nach dem 07.01.2013 nach Absprache mit der DNB.
>
>   
>
> Wir möchten Sie bitten, manuelle Ergänzungen von originalschriftlichen Feldern in vorhandene Datensätzen erst nach dem Einspielen der Verbunddaten vorzunehmen.
>
>   
>
> Begründung: Derzeit läuft noch das automatische Match-und-Merge-Verfahren, außerdem beginnt die Zusammenführung von viel genutzten Geografika im Januar.
>
>   
>
>   
>
>   
>
> Wenn wir mit den manuellen Ergänzungen bis nach dem Einspielen der Verbunddaten warten, wird vermieden, dass Datensätze mehrfach über den Änderungsdienst ausgeliefert werden müssen und die Schnittstellen belasten.
>
>   
>
>   
>
>   
>
> Neueingaben von Datensätzen mit originalschriftlichen Feldern sind kein Problem und können jetzt schon gemacht werden, Ergänzungen insbesondere von mit vielen Titeln verknüpften Personen oder Körperschaften dagegen noch nicht.
>
>   
>
>   
>
>   
>
> Mit freundlichen Grüßen
>
>   
>
>   
>
>   
>
> Brigitte Wiechmann
>
>   
>
>   
>
>   
>
>   
>
>   
>
> ***Lesen. Hören. Wissen. 100 Jahre Deutsche Nationalbibliothek***
>
>   
>
>   
>
>   
>
> Brigitte Wiechmann
>
>   
>
> Deutsche Nationalbibliothek
>
>   
>
> Arbeitsstelle für Standardisierung
>
>   
>
> Arbeitsstelle Normdateien
>
>   
>
> Adickesallee 1
>
>   
>
> D-60322 Frankfurt am Main
>
>   
>
> Tel: +49-69-15251488
>
>   
>
> Fax: -49-69-15251010
>
>   
>
> mailto:b.wiechmann at dnb.de <mailto:b.wiechmann at dnb.de>  <mailto:b.wiechmann at dnb.de <mailto:b.wiechmann at dnb.de> >
>
>   
>
> http://www.dnb.de<http://www.dnb.de/ <http://www.dnb.de%3chttp:/www.dnb.de/>
>
> <http://www.dnb.de%3chttp:/www.dnb.de/ <http://www.dnb.de%3chttp:/www.dnb.de/> > >
>
>   
>
> http://www.dnb.de/100jahre <http://www.dnb.de/100jahre>  <http://www.dnb.de/100jahre <http://www.dnb.de/100jahre> >
>
>   
>
>   
>
>   
>
>   
>
>   
>
>   
>
>   
>
>   
>
>   
>
>
>
> _______________________________________________
> gnd mailing list
> gnd at lists.d-nb.de
> http://lists.d-nb.de/mailman/listinfo/gnd


-- 
Monika Denker
HeBIS Verbundzentrale
Universitätsbibliothek Frankfurt am Main
Tel.: +49 (0)69 798 - 39656
Bockenheimer Landstr. 134, 60325 Frankfurt