AW: Antw: [gnd] Ergänzung von originalschriftlichen Ansetzungs- und Verweisungsformen aus dem SWB in der Ü-GND
Scheven, Esther
E.Scheven at dnb.de
Mon Feb 11 18:22:18 CET 2013
Liebe Frau Katz,
habe die Satzarten Tb, Tf, Tg im Approvalsystem getestet und einige Ungereimtheiten gefunden:
$g und $c sind normiert und müssen der 151 entsprechen; teilweise wurde die alte Ordnungshilfe nicht in $g umgesetzt, sondern die <>-Klammern wurden beibehalten; Zählungen gehören nicht in $g; teilweise wurde bei den Kongressen die ehemaligen spitzen Klammern mit Zählung, Jahr und Ort nicht in die richtigen Unterfelder, sondern in $g umgesetzt. In der angehängten Datei haben Sie Beispiele.
Eine grundsätzliche Frage zur Satzart Tg: Welcher Datensatz wurde jeweils angereichert? Die Datensätze sind alle sowohl in der ehemaligen SWD und GKD vorhanden; mal wurde der SWD-Satz genommen, mal der GKD-Satz. Welche Entscheidung lag dafür zugrunde?
Und hier noch eine Frage, weil ich von den Sprachen nichts verstehe: bei chines. Datensätzen ist häufig die Angabe in $U unterschiedlich. Das ist so in Ordnung, oder?(z.B. in der 4xx "hans" und in der 7xx "hant": http://d-nb.info/gnd/1025824490, http://d-nb.info/gnd/1025824490, aber auch umgekehrt: http://d-nb.info/gnd/50515-8)
Herzliche Grüße,
Esther Scheven
*** Lesen. Hören. Wissen. Deutsche Nationalbibliothek ***
--
Esther Scheven
Deutsche Nationalbibliothek
Inhaltserschließung
Adickesallee 1
D - 60322 Frankfurt am Main
Tel.: +49-69-1525-1547
Fax: +49-69-1525-1555
mailto:e.scheven at dnb.de
http://www.dnb.de
> -----Ursprüngliche Nachricht-----
> Von: gnd-bounces at lists.d-nb.de [mailto:gnd-bounces at lists.d-nb.de] Im Auftrag
> von Katz, Cornelia
> Gesendet: Montag, 11. Februar 2013 15:59
> An: Diskussionsliste Gemeinsames Normdatenformat
> Betreff: AW: Antw: [gnd] Ergänzung von originalschriftlichen Ansetzungs- und
> Verweisungsformen aus dem SWB in der Ü-GND
>
> Liebe Frau Denker,
> hier eine kurze Antwort:
> Bezüglich der Validation sucht die DNB nach einer Lösung diese vorübergehend zu
> entschärfen (z.B. für die Kennung, unter der wir das Skipt laufen lassen), damit wir
> auch mit dem Skript unsere Daten möglichst zügig in die ÜGND bekommen.
> Die Belegung von $5 war von Seiten der DNB so gewünscht, damit man sehen
> kann, aus welchem Verbund die Daten stammen, die "maschinell" importiert
> wurden.
> Viele Grüße
> Cornelia Katz
>
>
>
>
> Cornelia Katz
> Bibliotheksservice-Zentrum Baden-Wuerttemberg (BSZ)
> 78457 Konstanz / Germany
> Phone: +49 7531 88 3189
> E-Mail: cornelia.katz at bsz-bw.de
> http://www.bsz-bw.de
>
>
> -----Ursprüngliche Nachricht-----
> Von: gnd-bounces at lists.d-nb.de [mailto:gnd-bounces at lists.d-nb.de] Im Auftrag
> von Monika Denker
> Gesendet: Montag, 11. Februar 2013 14:46
> An: Diskussionsliste Gemeinsames Normdatenformat
> Betreff: Re: Antw: [gnd] Ergänzung von originalschriftlichen Ansetzungs- und
> Verweisungsformen aus dem SWB in der Ü-GND
>
> Liebe Frau Katz, liebe Kolleginnen,
>
> vielen Dank für die Berichterstattung über den Fortgang der Tests bezügl. der Ori-
> Schrift. Wir lesen dies interessiert mit und würden uns gerne mit gleichem
> Verfahren anschliessen.
> Es wundert nicht, dass der Weg per Skript im Onlineverfahren teilw.
> recht unbequem wird, da wir hinreichend Erfahrungen mit scharfer Validation
> haben. Dies wäre für uns durchaus ein Grund für ein Merging über Offline-
> Schnittstelle gewesen. Da unsere Datenmenge jedoch kleiner ist als die des SWB,
> wollen wir nicht schon vorab klagen.;-)
>
> Nun noch eine Frage zur Belegung von $5: hierzu gibt es doch keine verbindliche
> Verabredung? Hat der SWB interne Gründe für dessen
> Besetzung(Index) ?
> Wir hatten nicht vor, dieses Subf. zu belegen. Wir können und wollen doch sicher
> künftig nicht die Urheber einz. Ori-Schriften festhalten, schon garnicht in 4XX?
> Sollte es zu Divergenzen bei der Vorzugsbenennung kommen, sollte u.M.n.
> die betr. Sprachredaktion entscheiden.
>
> Viele Grüße
> Monika Denker
>
> Am 04.02.2013 16:01, schrieb Katz, Cornelia:
> > Liebe Frau Tölle,
> >
> > vielen Dank für die positive Rückmeldung!
> >
> > Doppelte Eintragungen in 7xx kamen durch unser Skript leider unbeabsichtigter
> Weise zustande (ist mir auch am Mittwoch aufgefallen), wenn im Approvalsystem
> nicht alle Sätze enthalten waren. Dann wurde im gerade bearbeiteten Satz nochmal
> ein bisschen etwas ergänzt. Im Produktionssystem kann das nicht vorkommen.
> Hier ein Beispiel:
> >
> >
> >
> > 005 Tp3
> >
> > 006 http://d-nb.info/gnd/1027432522
> >
> > 008 piz
> >
> > 011 f
> >
> > 035 gnd/1027432522
> >
> > 043 ZZ
> >
> > 100 Hisada, Masayoshi
> >
> > 400 $PHisada Masayoshi
> >
> > 400 $T01$UJpan%%$P????$5DE-576
> >
> > 400 $T01$UJpan%%$P????$5DE-576
> >
> > 548 1967$4datl
> >
> > 551 Setagaya-ku$4ortg
> >
> > 692 Genpatsu autoro- seishun hakusho. - 2012
> >
> > 700 $T01$UJpan%%??, ??$5DE-576$vOriginal
> >
> > 700 $T01$UJpan%%??, ??$5DE-576$vOriginal
> >
> > 903 $eDE-15
> >
> > 903 $rDE-576
> >
> >
> >
> > Es sollte nur noch in Einzelfällen vorkommen, dass 2 700er mit $vOriginal belegt
> sind.
> >
> >
> >
> > Viele Grüße
> >
> > Cornelia Katz
> >
> >
> >
> >
> >
> > Cornelia Katz
> >
> > Bibliotheksservice-Zentrum Baden-Wuerttemberg (BSZ)
> >
> > 78457 Konstanz / Germany
> >
> > Phone: +49 7531 88 3189
> >
> > E-Mail: cornelia.katz at bsz-bw.de
> >
> > http://www.bsz-bw.de
> >
> >
> >
> >
> >
> > -----Ursprüngliche Nachricht-----
> > Von: gnd-bounces at lists.d-nb.de [mailto:gnd-bounces at lists.d-nb.de] Im
> > Auftrag von Silke Tölle
> > Gesendet: Montag, 4. Februar 2013 15:43
> > An: Diskussionsliste Gemeinsames Normdatenformat
> > Betreff: Antw: [gnd] Ergänzung von originalschriftlichen Ansetzungs-
> > und Verweisungsformen aus dem SWB in der Ü-GND
> >
> >
> >
> > Liebe Frau Katz, liebe Kolleginnen und Kollegen der DNB,
> >
> > vielen Dank für die Information.
> >
> >
> >
> > Dazu zwei Anmerkungen:
> >
> >
> >
> > Wir haben die Sätze im Approval-System angesehen. Das sieht wirklich gut aus.
> Bei mindestens zwei Sätze ist uns aber aufgefallen, dass Feld 7XX $v Original
> doppelt vergeben ist. Das sollte nur einmal vorkommen.
> >
> > Evtl. sollte man das bei der Validation auch berücksichtigen. Mindestens im
> Erfassungsleitfaden sollte es aber auch ergänzt werden.
> >
> >
> >
> > Bei der Einspielung der Teilmengen möchten wir darum bitten, dass die
> Einspielung nicht zeitgleich zu einem Match- und Mergevorgang oder gar zu einer
> TOP500-Zusammenführung erfolgt. Sie schreiben, dass der genaue Einspieltermin
> ohnehin gemeinsam abgestimmt werden muss - dann müssen wir diese Frage
> entsprechend berücksichtigen.
> >
> >
> >
> > Viele Grüße
> >
> > Silke Tölle
> >
> >
> >
> >
> >
> >
> >
> > ---
> >
> > Silke Tölle
> >
> > hbz - Hochschulbibliothekszentrum NRW
> >
> > Datenbankservices und Verbunddienstleistungen Postfach 27 04 51 50510
> > Koeln Tel. +49-221-40075-119 Fax +49-221-40075-169 toelle at hbz-nrw.de
> > <mailto:toelle at hbz-nrw.de> www.hbz-nrw.de <http://www.hbz-nrw.de>
> >
> > ---
> >
> >>>> "Katz, Cornelia" <Cornelia.Katz at bsz-bw.de
> >>>> <mailto:Cornelia.Katz at bsz-bw.de> > 30.01.2013 12:39 >>>
> > Liebe Kolleginnen und Kollegen in der DNB und den Verbundsystemen,
> >
> >
> >
> >
> >
> >
> >
> > im BSZ befinden wir uns nun in der Testphase für das Ergänzen unserer
> originalschriftlichen Ansetzungs- und Verweisungsformen in der Ü-GND.
> >
> >
> >
> >
> >
> >
> >
> > Ich will an dieser Stelle kurz schildern, wie wir dies - selbstverständlich nach
> durchgeführter Absprache mit der DNB - durchführen. Wir gehen in folgenden
> Schritten vor:
> >
> >
> >
> >
> >
> >
> >
> > 1. Selektion der relevanten GND-Normdatensätze mit Originalschrift
> >
> >
> >
> > 2. Download über WinIBW im Erfassungsformat
> >
> >
> >
> > 3. Konvertierung (per Programm) der orginalschriftlichen Inhalte aus
> > den SWB-spezifischen Feldern in die Felder 4xx und 7xx, dabei werden
> >
> > $5DE-576 und $vOriginal (in 7xx) ergänzt
> >
> >
> >
> > 4. Erzeugung einer entsprechenden Datei als Input für das
> > WinIBW-Skript
> >
> >
> >
> > 5. Über ein im BSZ erstelltes WinIBW-Skript werden die in der Datei enthaltenen
> Sätze gelesen, in der Ü-GND gesucht und im "Bearbeiten-Modus" die
> originalschriftlichen Felder ergänzt.
> >
> >
> >
> >
> >
> >
> >
> > Seit Montag testet Frau Scherer das Ergänzen der originalschriftlichen
> >
> > Ansetzungs- und Verweisungsformen über unser WinIBW-Skript im Approval-
> System der DNB. Die Einspielung erfolgt in Teilmengen. Die Gesamtmenge bewegt
> sich zwischen 13.000 und 14.000 zu ergänzenden Sätzen. Das Skript schafft ca.
> 1000 Sätze in 15 bis 20 Minuten.
> >
> >
> >
> >
> >
> >
> >
> > Die bereits ergänzten Sätze können Sie anschauen. Über die WinIBW sind diese
> mit der Suche "f aai de576" zu ermitteln.
> >
> >
> >
> >
> >
> >
> >
> > Leider war es mit dem Schreiben des Konvertierungsprogramms und der
> Erstellung des WinIBW-Skript nicht getan. Die Validation beim Eintragen der Daten
> in den Ü-GND-Sätzen schlägt doch an einigen Stellen zu, sodass Frau Scherer
> sowohl das Skript nachgebessert hat, als auch intellektuell manuell bei einigen
> Datensätzen eingreifen muss, damit die Speicherung erfolgen kann.
> >
> >
> >
> > Hierzu einige Anmerkungen:
> >
> >
> >
> >
> >
> >
> >
> > - Bei den originalschriftlichen Feldern haben wir im SWB
> >
> > grundsätzlich eine andere Validation, sodass im SWB originalschriftliche
> Namensformen ohne Komma als Nachnamen gespeichert werden konnten. In der
> Ü-GND kann man diese in den 400er-Feldern nur als persönliche Namen
> abspeichern (also in $P), während man diese in den 700er-Feldern auch als
> Nachnamen (Belegung von Pica+ $a) abspeichern kann (Beispiel: GND 174027214).
> >
> > Bei arabischen Schriften kommt noch die Problematik hinzu, dass das arabische
> Komma in der Pica3/Pica+-Konvertierung nicht als Komma erkannt wird und somit
> dies auch ein persönlicher Name in Feld 400 validiert wird (also $P erwartet wird),
> während in 700 die Speicherung als Nachname erfolgt (Beispiel: GND 122408853).
> >
> >
> >
> > Zumindest die unterschiedliche Validation sollte in der Ü-GND für die Felder 400
> und 700 noch bereinigt werden!
> >
> >
> >
> > Wir im BSZ arbeiten derzeit die als Nachnamen gespeicherten Ansetzungsformen
> in persönliche Namen um, indem $P belegt wird.
> >
> >
> >
> > - Validationsmeldung bei Personen für fehlende
> >
> > Individualsierungsmerkmale bei Eintrag Originalschrift. Taucht in einigen, bisher
> wenigen, Fällen auf. Dazu ergänzt Frau Scherer parallel im Approval und
> Produktionssystem die Merkmale (manuell, nach entspr.
> >
> > Recherche). Wir gehen davon aus, dass der Zustand bis zu unserer Einspielung
> so bleibt, bis die im Rahmen des letzten CJK-Workshops besprochene
> Verfahrensweise, dass die Ergänzung der Originalschrift als
> Individualisierungsmerkmal gilt, in der EG Normdaten bestätigt und von der DNB
> entspr. umgesetzt wird.
> >
> >
> >
> >
> >
> >
> >
> > - Validationsmeldung bei Tp-SE-Sätzen auf fehlenden Ländercode und
> >
> > Quellenangabe. Diese ergänzt Frau Scherer parallel im Approval und
> > Produktionssystem (manuell, intellektuell)
> >
> >
> >
> > - Fehlende Ländercodes und Entitätencodes in älteren Tb-Sätzen
> >
> > werden innerhalb des Skriptes ergänzt
> >
> >
> >
> >
> >
> >
> >
> > - Weitere Validationsfehler können sein: fehlendes $4 bei
> >
> > 5xx-Feldern, fehlendes $b bei 678, fehlerhafte LC-Aut-Eintragungen (s.
> >
> > GND 118574647, sehr viele Zeilen zu korrigieren)
> >
> >
> >
> >
> >
> >
> >
> > Fazit: bei diesem Verfahren gibt es unendlich viel zu korrigieren (auch bedingt
> durch die Validation in der Ü-GND, die bei maschinell eingespielten Sätzen und vor
> Jahren unter anderen Bedingungen angelegten Sätzen, gnadenlos zuschlägt),
> damit die Sätze überhaupt gespeichert werden können.
> >
> >
> >
> >
> >
> >
> >
> > Wir können uns hier im BSZ eine Übertragung der originalschriftlichen
> >
> > Ansetzungs- und Verweisungsformen aus dem SWB in der zweiten Februarhälfte
> vorstellen. Ein genauer Termin ist noch gemeinsam zu bestimmen.
> >
> >
> >
> >
> >
> >
> >
> > Für die Beantwortung von Fragen zum Verfahren stehen wir gern zur Verfügung.
> >
> >
> >
> >
> >
> >
> >
> > Viele Grüße
> >
> >
> >
> > Cornelia Katz
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> > Cornelia Katz
> >
> >
> >
> > Bibliotheksservice-Zentrum Baden-Wuerttemberg (BSZ)
> >
> >
> >
> > 78457 Konstanz / Germany
> >
> >
> >
> > Phone: +49 7531 88 3189
> >
> >
> >
> > E-Mail: cornelia.katz at bsz-bw.de <mailto:cornelia.katz at bsz-bw.de>
> >
> >
> >
> > http://www.bsz-bw.de <http://www.bsz-bw.de>
> >
> >
> >
> >
> >
> >
> >
> > -----Ursprüngliche Nachricht-----
> >
> > Von: gnd-bounces at lists.d-nb.de <mailto:gnd-bounces at lists.d-nb.de>
> > [mailto:gnd-bounces at lists.d-nb.de <mailto:gnd-bounces at lists.d-nb.de> ]
> > Im Auftrag von Wiechmann, Brigitte
> >
> > Gesendet: Mittwoch, 5. Dezember 2012 15:32
> >
> > An: Diskussionsliste Gemeinsames Normdatenformat (gnd at lists.d-nb.de
> > <mailto:gnd at lists.d-nb.de> )
> >
> > Betreff: [gnd] Originalschriftliche Eingabe in die GND
> >
> >
> >
> >
> >
> >
> >
> > Liebe Kolleginnen und Kollegen,
> >
> >
> >
> >
> >
> >
> >
> > inzwischen sind die technischen Voraussetzungen zur Eingabe von Originalschrift
> in die GND-Datensätze getroffen worden.
> >
> >
> >
> >
> >
> >
> >
> > Erste Einspielungen von Verbunddaten erfolgen nach dem 07.01.2013 nach
> Absprache mit der DNB.
> >
> >
> >
> > Wir möchten Sie bitten, manuelle Ergänzungen von originalschriftlichen Feldern
> in vorhandene Datensätzen erst nach dem Einspielen der Verbunddaten
> vorzunehmen.
> >
> >
> >
> > Begründung: Derzeit läuft noch das automatische Match-und-Merge-Verfahren,
> außerdem beginnt die Zusammenführung von viel genutzten Geografika im Januar.
> >
> >
> >
> >
> >
> >
> >
> > Wenn wir mit den manuellen Ergänzungen bis nach dem Einspielen der
> Verbunddaten warten, wird vermieden, dass Datensätze mehrfach über den
> Änderungsdienst ausgeliefert werden müssen und die Schnittstellen belasten.
> >
> >
> >
> >
> >
> >
> >
> > Neueingaben von Datensätzen mit originalschriftlichen Feldern sind kein Problem
> und können jetzt schon gemacht werden, Ergänzungen insbesondere von mit
> vielen Titeln verknüpften Personen oder Körperschaften dagegen noch nicht.
> >
> >
> >
> >
> >
> >
> >
> > Mit freundlichen Grüßen
> >
> >
> >
> >
> >
> >
> >
> > Brigitte Wiechmann
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> > ***Lesen. Hören. Wissen. 100 Jahre Deutsche Nationalbibliothek***
> >
> >
> >
> >
> >
> >
> >
> > Brigitte Wiechmann
> >
> >
> >
> > Deutsche Nationalbibliothek
> >
> >
> >
> > Arbeitsstelle für Standardisierung
> >
> >
> >
> > Arbeitsstelle Normdateien
> >
> >
> >
> > Adickesallee 1
> >
> >
> >
> > D-60322 Frankfurt am Main
> >
> >
> >
> > Tel: +49-69-15251488
> >
> >
> >
> > Fax: -49-69-15251010
> >
> >
> >
> > mailto:b.wiechmann at dnb.de <mailto:b.wiechmann at dnb.de>
> > <mailto:b.wiechmann at dnb.de <mailto:b.wiechmann at dnb.de> >
> >
> >
> >
> > http://www.dnb.de<http://www.dnb.de/
> > <http://www.dnb.de%3chttp:/www.dnb.de/>
> >
> > <http://www.dnb.de%3chttp:/www.dnb.de/
> > <http://www.dnb.de%3chttp:/www.dnb.de/> > >
> >
> >
> >
> > http://www.dnb.de/100jahre <http://www.dnb.de/100jahre>
> > <http://www.dnb.de/100jahre <http://www.dnb.de/100jahre> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> >
> > _______________________________________________
> > gnd mailing list
> > gnd at lists.d-nb.de
> > http://lists.d-nb.de/mailman/listinfo/gnd
>
>
> --
> Monika Denker
> HeBIS Verbundzentrale
> Universitätsbibliothek Frankfurt am Main
> Tel.: +49 (0)69 798 - 39656
> Bockenheimer Landstr. 134, 60325 Frankfurt
>
> _______________________________________________
> gnd mailing list
> gnd at lists.d-nb.de
> http://lists.d-nb.de/mailman/listinfo/gnd
>
>
>
> _______________________________________________
> gnd mailing list
> gnd at lists.d-nb.de
> http://lists.d-nb.de/mailman/listinfo/gnd
-------------- next part --------------
A non-text attachment was scrubbed...
Name: Test-Tb-Tf-Tg.docx
Type: application/vnd.openxmlformats-officedocument.wordprocessingml.document
Size: 50616 bytes
Desc: Test-Tb-Tf-Tg.docx
Url : http://lists.d-nb.de/pipermail/gnd/attachments/20130211/0b4fddfe/Test-Tb-Tf-Tg-0001.bin