AW: [gnd] Dateneinspielungen in die GND - Bedarfserhebung
Katz, Cornelia
Cornelia.Katz at bsz-bw.de
Mit Jul 4 15:57:50 CEST 2012
Liebe Frau Wiechmann, liebe Frau Pfeifer,
wie schon in Hamburg angedeutet, gibt es in der SWB-Datenbank noch Tp-Sätze, die in die überregionale Datenbank übertragen werden müssen. Unabhängig von Ihrer Mail haben wir uns dazu vor einigen Tagen zusammengesetzt und Herr Kühn hat folgendes Konzept verfasst, aus welchem ich hier einige Teile zitieren möchte:
1. Bereinigung von Tn-Sätzen: Tn-Sätze mit Lebensdatum (Feld 548) und einer Titelverknüpfung werden in Tpi-Sätze umgewandelt (Anzahl noch unbekannt)
2. Abgleich der Tp-Sätze:
Es gibt zurzeit folgende Personensätze im SWB die nicht Teil der GND sind:
* ca. 165.000 Tpi-Sätze (zuzüglich der Sätze aus der Tn-Bereinigung unter Punkt 1)
* ca. 61.000 Tp8-Sätze
* ca. 10.000 Tp9-Sätze
Aus Aufwands- und Schwierigkeitsgründen (Ansetzungen aus dem Südostasiatischen Sprachraum) werden die Tp8-Sätze nicht für eine GND-Lieferung berücksichtigt.
Die Tpi- und Tp9-Sätze sollen in die GND überführt werden.
Dazu ist ein zweistufiger Abgleich innerhalb der SWB-Datenbank vorgesehen:
1. Die Tpi- und Tp9-Sätze werden untereinander verglichen; eindeutige Dubletten werden zusammengelegt. Mögliche Dubletten werden identifiziert und ggf. manuell nachbearbeitet.
2. Die übrig bleibenden Sätze werden mit den Tpv-Sätzen (aus der Ü-GND) verglichen. Wir beabsichtigen dabei die maschinell eingespielten Tp-Sätze in der GND (Sätze mit dem Level 6, 7 und 8) aufgrund der schlechten Qualität nicht für den Abgleich heranzuziehen (es wäre natürlich gut, wenn diese Sätze noch innerhalb der Ü-GND mit maschinellen Verfahren bereinigt würden, bevor weitere maschinelle Einspielungen im größeren Stil vorgenommen werden). Beim Abgleich werden Dubletten zusammengelegt. Mögliche Dubletten werden identifiziert und ggf. manuell nachbearbeitet.
3. Einspielen der Restmenge Tp-Sätze in die überregionale GND. Wir erwarten, dass auch nach dem SWB-internen Dublettenabgleich die Anzahl der in die Ü-GND einzuspielenden Sätze die 100.000 übersteigen wird, sodass wir eine Batch-Lieferung mit Einspielung vorziehen würden. Die Möglichkeit, Daten per Skript über die WinIBW einzuspielen, schließen wir hierbei - aufgrund der im Rahmen des Leo-Projektes gemachten Erfahrungen - aus.
4. Originalschriften: im SWB gibt es sowohl in den Personen- als auch in den Körperschaftssätzen originalschriftliche Ansetzungs- und Verweisungsformen. Für diese müssten wir uns auch über eine Lieferung verständigen, um bei der Einführung der Originalschrift eine Vorgehensweise zu haben.
Herzliche Grüße
Cornelia Katz
Cornelia Katz
Bibliotheksservice-Zentrum Baden-Wuerttemberg (BSZ)
78457 Konstanz / Germany
Phone: +49 7531 88 3189
E-Mail: cornelia.katz at bsz-bw.de
http://www.bsz-bw.de
-----Ursprüngliche Nachricht-----
Von: gnd-bounces at lists.d-nb.de [mailto:gnd-bounces at lists.d-nb.de] Im Auftrag von Pfeifer, Barbara
Gesendet: Montag, 2. Juli 2012 12:04
An: gnd at lists.d-nb.de
Cc: Grund, Stefan
Betreff: [gnd] Dateneinspielungen in die GND - Bedarfserhebung
++++Bitte entschuldigen Sie Mehrfachempfang++++
Liebe Kolleginnen und Kollegen,
der Alltag in der Normdatenarbeit kehrt langsam wieder ein und wir möchten das Thema Dateneinspielungen in die GND aufgreifen, auf das wir in den letzten Wochen angesprochen wurden.
Der GBV möchte gerne ca. 700.000 verbundinterne Normdatensätze der Satzart Tp in die überregionale GND einspielen. Die Datensätze stammen aus unterschiedlichen Bibliotheken; die Kontingente umfassen zwischen über 200.000 Datensätze bis zu unter 100 Datensätzen.
Mit dieser Mail möchten wir den Bedarf aus anderen Verbünden ermitteln. Wenn wir diesen zusammengestellt haben und die Größe der Kontingente wissen, benötigen wir Ihre Zustimmung dazu bzw. eine Aussage dazu, ob Sie diese Datenmengen in Ihrem Verbund einspielen können.
Hier eine grobe Skizze des möglichen Ablaufs:
* Datenabgleiche zur überregionalen GND sollen vom Verbund vorab selbst durchgeführt werden.
* Kleine Datenmengen können unter "Moderation" der DNB per WINIBW-Skript sukzessive in kleinen Mengen in die GND im Online-Betrieb vom Anwender selbst eingespielt werden.
* Größere Datenmengen werden von DNB maschinell eingespielt und über die halbjährlichen Grundbestände den Partnern zur Verfügung gestellt. Frühester Zeitpunkt dazu ist Frühjahr 2013.
* Die Selektion der Daten wird über Identifikationsnummernbereiche möglich sein.
* Vorab sollten Testdaten an die DNB geliefert werden
Bitte teilen Sie uns bis zum 13. Juli 2012 mit, ob aus Ihrem Verbund auch noch Datenkontingente auf die Einspielung in die GND warten.
Herzliche Grüße Brigitte Wiechmann und Barbara Pfeifer
--
Barbara Pfeifer
Deutsche Nationalbibliothek
Arbeitsstelle für Standardisierung
Personennamendatei (PND)
Adickesallee 1
D-60322 Frankfurt am Main
Telefon: +49-69-1525-1403
Telefax: +49-69-1525-1010
mailto:b.pfeifer at dnb.de
http://www.dnb.de
_______________________________________________
gnd mailing list
gnd at lists.d-nb.de
http://lists.d-nb.de/mailman/listinfo/gnd