AW: [gnd] WG: Testdaten im GND-MARC-Format - ZDB-Rückmeldung -

Kubbernuß, Antje A.Kubbernuss at dnb.de
Don Feb 10 13:25:58 CET 2011


Liebe Frau Patzer,

vielen Dank an Sie und Ihre KollegInnen für die Durchsicht der Testdaten. 
Die Antworten zu Ihren einzelnen Fragen finden sie unten im Text.

Bitte melden Sie sich noch einmal, wenn etwas unverständlich ist oder Sie noch weitere Fragen haben.

Viele Grüße
Antje Kubbernuß

**** Bitte beachten Sie die neue Internet- und E-Mail-Adresse. ****

-- 
Antje Kubbernuß 
Deutsche Nationalbibliothek 
Arbeitsstelle für Standardisierung 
Gemeinsame Körperschaftsdatei (GKD) 
Deutscher Platz 1 
D-04103 Leipzig 
Telefon: +49-341-2271-472 
Telefax: +49-341-2271-555 
mailto:a.kubbernuss at dnb.de 
http://www.dnb.de 

 

>-----Ursprüngliche Nachricht-----
>Von: gnd-bounces at lists.d-nb.de 
>[mailto:gnd-bounces at lists.d-nb.de] Im Auftrag von Patzer, Karin
>Gesendet: Dienstag, 18. Januar 2011 09:34
>An: 'Diskussionsliste Gemeinsames Normdatenformat'
>Betreff: [gnd] WG: Testdaten im GND-MARC-Format - ZDB-Rückmeldung - 
>
>Liebe Frau Feilhauer, liebe Kolleginnen und Kollegen, 
>
>die GKD Berlin und die ZDB haben die Testdaten im 
>GND-MARC-Format bezüglich der Ansetzung von Geografika und 
>Körperschaften geprüft. Folgende Anmerkungen bzw. Fragen haben 
>sich nun ergeben: 
>
>Felder 001, 003, 005, 008: fehlen hier die beiden Leerzeichen 
>für die Indikatoren? Der Feldinhalt beginnt gleich nach der 
>Feld-Nummer.

In dem MARC21 Format haben die Felder 00X - Control Fields keine Indikatoren (vgl. http://www.loc.gov/marc/authority/ad00x.html) und beginnen direkt mit dem Feldinhalt.


>Bei den Beispielen 1, 2, 7 (Wiener Seelsorgertagung, GKD-Nr. 
>4193-2; Weihnachts-Seelsorgertagung, GKD-Nr. 6231-5 und 
>Österreich, GKD-Nr. 35878-2) ist in der GKD jeweils das Feld 
>450 |b| besetzt für zwischenzeitliche Ansetzungen. In den 
>MARC-21-Beispielen werden diese Verknüpfungen jeweils als 
>"Vorgänger" und "Nachfolger" angegeben. Ist das korrekt? Oder 
>müsste hier ein "Siehe-auch-Hinweis" erfolgen?

Hier eine Übersicht über die Vorgaben zur Migration der Indikatoren von GKD-Feld 450 (PICA):

GKD/PICA3	Bezeichung	GND/MARC21 - Umsetzung in Relation	
450 |a|	früherer Name (reziprok)	510/511/551 Vorgaenger	
450 |m|	früherer Name (nicht reziprok)	510/511/551 Vorgaenger	
450 |c|	späterer Name (reziprok)	510/511/551 Nachfolger	
450 |o|	späterer Name (nicht reziprok)	510/511/551 Nachfolger	
450 |d|	früherer und späterer Name	510/511/551 Vorgaenger + 510/511/551 Nachfolger	
450 |b|	zeitweise Name	510/511/551 Vorgaenger + 510/511/551 Nachfolger	
450 |s|	siehe auch	510/511/551 Relation allgemein	

In 450 sind Körperschafts-Sätze verknüpft, die zur vorliegenden Körperschaft entweder in einer chronologischen (Indikatoren a-o) oder in einer parallelen (Indikator s) Beziehung stehen.
Die chronologischen Beziehungen werden in eine Vorgänger/Nachfolger-Relation umgesetzt, die parallelen Beziehungen in eine allgemeine Relation.
Besteht aus Ihrer Sicht die Notwendigkeit, die Sätze die Verknüpfungen zu zwischenzeitlichen Namen anders zu behandeln?


>Bei Beispielen 6 (Universidad Complutense Madrid, GKD 25995-0) 
>und 9 (Københavns Universitet, GKD-Nr. 36485-X) werden die 
>Zusätze aus den GKD-Aufnahmen jeweils unterschiedlich 
>umgesetzt (abgetrennt durch Komma oder Angabe in Unterfeld 
>$9g. Wir bevorzugen die Abtrennung durch Komma (Beispiel 6).

Bei den angesprochenen Beispielen greifen die Umsetzungsregeln für ortsgebundenen Körperschaften.
Die Vorgabe sieht bisher vor, dass die Ordnungshilfe bei ortsgebundenen Körperschaften aufgelöst und
- bei kurzen Namensformen (1-2 Wörter) direkt an den Namen angeschlossen wird bzw.
- bei längeren Namensformen komplett entfällt.
In jedem Fall wird der Ort in 551 relationiert.

Da die Migration und Relationierung in einem gestuften Verfahren entwickelt und programmiert wird, haben wir, um Ihnen Beispiele im Zielformat zur Verfügung stellen zu können, an einigen Stellen manuell nachkorrigiert. Dies trifft bei der genannten Regel zu. In Beispiel 6 wurde die Regel manuell richtig umgesetzt, in Beispiel 9 nicht. In Beispiel 6 wurde die Ordnungshilfe komplett zur Namensform hinzugezogen. Das Komma stammt ebenfalls aus der Ordnungshilfe, da diese aus mehreren Bestandteilen besteht. In Beispiel 9 ist die Verweisungsform mit $g ein Fall, wo die Ordnungshilfe zur Unterscheidung von einer gleichnamigen Namensform in einem anderen GKD-Satz dient. Bei der manuellen Korrektur ist sie daher  nach $g gekommen, maschinell wäre sie nach der beschriebenen Vorgabe aufgelöst und (ohne Komma) zur Namensform in $a hinzugezogen worden.

Das zeigt, dass die Regel nicht in allen Fällen ausreichend greift.
Daher werden wir eine neue Herangehensweise erproben: Über einen Abgleich der Ansetzungsformen werden die ortsgebundenen Körperschaften ermittelt, deren Namensform nur einmal vorkommt. Hier soll die Ordnungshilfe, also 110 $g komplett entfallen und der Ort nur über 551 relationiert werden. Wo es mehrere gleichnamige Körperschaften gibt, bleibt 110 $g erhalten. Für normierte Ansetzungen, z. B. Universitäten, wird es eine Sonderregel geben, so dass der Ort aus der Ordnungshilfe nicht in $g bleibt, sondern zum Namen hinzugezogen wird.

Zur Verdeutlichung noch einmal die Auszüge aus den Beispielen:

Bsp. 6 (PICA 3)
GKD: 250 Universidad <Madrid, Universidad Complutense>
GND (alte Vorgabe): 410 Universidad Madrid, Universidad Complutense
GND (neue Vorgabe): 410 Universidad Madrid $gUniversidad Complutense

Bsp. 9 (PICA 3)
GKD: 250 Academia Havniensis <Københavns Universitet>
GND (alte Vorgabe): 410 Academia Havniensis Københavns Universitet (in Testdaten falsch: $gKøbenhavns Universitet)
GND (neue Vorgabe): 410 Academia Havniensis$gKøbenhavns Universitet


>Beispiel 18 (Bezirk Neuburg Donau, GKD-Nr. 1018060-6): Die 
>Ansetzung in der GKD lautet: Neuburg <Donau, Bezirk>. Warum 
>wurde die Art der Einheit in die Ansetzung einbezogen? Weil 
>Verwaltungseinheiten nach ihrem eigenen gebräuchlichen 
>Eigennamen angesetzt werden (G3 der Übersicht Übergansregeln 
>zu Geografika vom 24.8.2010)? Analoger Fall in Beispiel 19. 
>

Ja, hier wird nach Möglichkeit die Übergangsregel maschinell umgesetzt.

>Uns ist aufgefallen, dass einige GKD-Ordnungshilfen bei der 
>Ansetzung von Geografika jeweils mit Komma angeschlossen 
>werden (Beispiel 5: New York, NY), bei "normalen" 
>ortsgebundenen Körperschaften wird der bisher normiert 
>hinzugefügte Ortssitz wohl als zum Namen zugehörig belassen 
>(Beispiel 6: Universidad Complutense Madrid). Im 
>Spielgelstrich zuvor haben wir ausgeführt, dass die Art der 
>Einheit bei der Ansetzung schon einbezogen worden ist, die 
>Angabe "Donau" erfolgt im $ 9g. Könnten Sie kurz erläutern, 
>wann eine GKD-Ordnungshilfe mit Komma angeschlossen wird und 
>wann sie im Unterfeld 9g landet? Das ist uns nicht ganz klar. 
>

Zur Behandlung der ortsgebundenen Angaben siehe meine obigen Ausführungen zu den Beispielen 6 + 9.
Es gibt einige Fälle im Bereich der Gebietskörperschaften, wo die Ordnungshilfe mit Komma an die Namensform in 151/451 $a angeschlossen wird (identisch für GKD+SWD):
- amerikanische Bundesstaaten (nach RAK-Anl. 8); ggf. Bundesstaaten und Territorien Australiens (RAK-Anl. 13) sowie Provinzen und Territorien Kanadas (RAK-Anl. 15) - letztere Fälle sind noch in der Prüfung
- Gebietskörperschaften, die zur Unterscheidung von Gleichnamigkeit eine naturäumliche Einheit als Ordnungshilfe besitzen (vgl. RSWK §201,b: Kontinente, Landschaften, Gebirge, Berge, Inseln, Küsten, Täler, Klüsse, Seen, Meere, Meeresteile etc.). Die naturräumlichen Einheiten werden über einen Abgleich mit der SWD identifiziert.

Die Ansetzung im Beispiel 18 (Bezirk Neuburg Donau) ist bei der manuellen Bearbeitung falsch umgesetzt worden.
Die Herauslösung der Bezeichnung für die Verwaltungseinheit aus der Ordnungshilfe und die Umsetzung des Ortes wird erst in bei der Relationierung maschinell durchgeführt werden.
Die Verwaltungseinheit wird an den Anfang von 151/451 $a gestellt. Naturräumliche Einheiten und Bundestaaten werden, wie beschrieben, mit Komma an den Ort angeschlossen. Evtl. andere Angaben aus der Ordnungshilfe kommen nach $g.

Bsp. 18 (PICA):
GKD: 150 Neuburg <Donau, Bezirk>
GND: 151 Bezirk Neuburg, Donau (korrektes Zielformat)

Sowohl bei den Gebietskörperschaften als auch den "normalen" Körperschaften werden alle Angaben, die zur Unterscheidung von Gleichnamigkeit benötigt werden, in $g abgelegt. (Sofern nicht eine der genannten Ausnahme-Regeln greift.)

>Können Sie bitte erläutern, in welchen Fällen die 
>Übergangsregeln bereits maschinell bei der Umsetzung der 
>GKD-Sätze in die GND greifen? Das ist für uns wichtig für die 
>Einschätzung von Titelfolgekorrekturen in der ZDB. 

Nachfolgend habe ich Ihnen den aktuellen Stand aufgelistet. Er betrachtet die Umsetzung nur aus Perspektive der GKD.

Kongresse

- C 1.5 (Hinzuzufügende identifizierende Merkmale und Relationen): Umsetzung der Ordnungshilfe in einzelne Unterfelder: Zählung => $n, Jahr => $d, Ort => $c, Rest => $g sowie Relationierung von Jahr, Ort und veranstaltender Körperschaft in 5XX

Körperschaften

- K-E 1.4 (Namensänderungen - Ordnungshilfe / Zusatz): Diese Regel kann voraussichtlich über einen Match-&-Merge-Lauf innerhalb der GKD maschinell umgesetzt werden. Betroffen sind in erster Linie Splits in der GKD, die aufgrund von Änderungen in der Ordnungshilfe vorgenommen wurden. Diese Sätze müssen nach der Übergangsregel wieder zusammengeführt werden - das hat Auswirkungen auf den Titelbestand. Die Vorgaben für das Match-&-Merge-Verfahren werden zur Zeit erarbeitet, zum Umfang der betroffenen Sätze können wir leider noch keine Angaben machen. Die Zusammenführung wird erst nach dem Produktivstart der GND über Umlenkverfahren vorgenommen werden.

- K-E 3 (Körperschaften - ortsgebunden): Wie erläutert, werden die Ordnungshilfen mit Angaben zum Sitz nach Möglichkeit aufgelöst. Die Orte werden in 5XX relationiert.

- K-E 9.5 (Spitzen-, Exekutiv- und Informationsorgane, Vertretungskörperschaften von Gebietskörperschaften): Im GND-Format ist die Ablage dieser Namensformen als Verweisungen von Gebietskörperschaften (Tg-Sätze) nicht vorgesehen. Hier soll daher versucht werden, die Exekutiv-, Informations- und Spitzenorgane aus dem Satz der Gebietskörperschaft herauszulösen und maschinell neue Sätze zu bilden, die ggf. mit parallelen SWD-Sätzen zusammengeführt werden.

- K-E 10.3 (Spitzenorgane, Exekutiv- und Informationsorgane von Religionsgemeinschaften): Analog zu K-E 9.5 für den Fall, dass die regionalen Einheiten von Religionsgemeinschaften als Geografika umgesetzt werden (vgl. G-E 3).


Gebietskörperschaften

- G-E 1 (Geografika allgemein), G-E 1.1 (Namensänderungen bei Geografika): Hier kann es durch abweichende Entitäten in GKD und SWD zu Veränderungen kommen. Einzelheiten zum Umfang können noch nicht benannt werden. Die Problematik wird im Rahmen des Match-&-Merge-Verfahrens genauer abgeklärt.

- G- E 3 (Regionale Einheiten von Religionsgemeinschaften): Die regionalen Einheiten von Religionsgemeinschaften werden künftig als Geografika behandelt. In der GKD sind sie nicht gekennzeichnet. Sie können aber dennoch teilweise durch die Begriffe für die Verwaltungseinheit identifiziert werden. In diesem Fall erfolgt die Umwandlung in "Tg"-Sätze sowie die Relationierung zum Gattungsbegriff in 550.

- G3 (Verwaltungseinheiten): Bei identifizierbaren Gattungsbegriffen wird dieser aus der Ordnungshilfe gelöst und an den Anfang von 151/451 $a gesetzt. (Gilt nur bei weltlichen Verwaltungseinheiten sowie bei "Hochstift"; bei religiösen Verwaltungseinheiten ist der Gattungsbegriff i.d.R. nicht aus dem Namen herausgelöst worden.) Zusätzlich erfolgt die Relationierung zum Gattungsbegriff in 550.


>Herzlichen Dank, viele Grüße und noch alles Gute für das neue Jahr 2011
>
>Karin Patzer
>
>********************************************
>Karin Patzer
>Staatsbibliothek zu Berlin
>Abt. IIE, Überreg.Bibliogr.Dienste
>- Zeitschriftendatenbank, ZRT -
>10772 Berlin
>
>Tel.: +49 30 266-434219
>Fax: +49 30 266-334015
>mailto: karin.patzer at sbb.spk-berlin.de
>http://www.zeitschriftendatenbank.de
>
>     -----Ursprüngliche Nachricht-----
>Von: gnd-bounces at lists.d-nb.de 
>[mailto:gnd-bounces at lists.d-nb.de] Im Auftrag von Feilhauer, Petra
>Gesendet: Mittwoch, 15. Dezember 2010 16:39
>An: Diskussionsliste Gemeinsames Normdatenformat
>Cc: Kett, Jürgen; polakl; Altenhoener, Reinhard; Althaus, Bernd
>Betreff: [gnd] Testdaten im GND-MARC-Format
>
>Liebe KollegInnen,
>
>die ersten maschinell erzeugten GND-Daten im MARC 
>Austauschformat liegen zum Abholen auf dem FTP-Server der DNB bereit.
>Die Zugangskennung ist der FTP-Account bzw. der WWW-Account 
>des jeweiligen Verbundes.
>
>Dateiname:  GNDTestlieferungutf8.mrc  (130 Datensätze); 
>Zeichensatz: utf8
>
>
>Es sind 130 Testsätze, die querbeet viele Fälle aus der 
>Normdaten-Welt abdecken:
>
>    16 : Körperschaften
>      9 : Kongresse
>     37: Geografika
>     17: Personen
>     44: Sachbegriffe
>       7: Werke
>
>Fingierte Beispiele sind:
>1100000224
>1100000232
>1100000240
>1100000216
>1100000267
>974049557
>300989539
>1100000283
>1100000291
>
>
>Im Normdaten-Wiki  https://wiki.d-nb.de/x/TYLZAQ finden Sie:
>-	die aktuelle GND-Format-Beschreibung, GND-Format V.06
>enthält Korrekturen, Ergänzungen bes. für Pica-Format;  
>-	vorläufige Codeliste, die in den Testdaten verwendet wurde 
>-	Testdaten in einer lesbaren Darstellung in den Formaten 
>GND-MARC und GND-Pica
>
>Was noch fehlt:
>-	Hinweissätze
>
>Fehler, die uns bekannt sind, aber erst zu spät entdeckt 
>wurden, um sie zu bereinigen:
>-	Feld 375 $a: Konversionsfehler des Codes 'weiblich': In 
>den Daten gelten also alle 11 Frauen als "unbekannten 
>Geschlechtes". Sie haben den Code '0' :-(
>
>
>Ansprechpartner für Fragen sind:
>-	FTP-Zugang etc. Frau Noreiks (b.noreiks at d-nb.de), Frau 
>Schuh (a.schuh at d-nb.de) 
>-	GND-Testdaten (IT): Frau Feilhauer 
>(p.feilhauer at d-nb.de), Herr Heuvelmann (r.heuvelmann at d-nb.de)
>-	GND-Testdaten (Fachlich): Frau Pfeifer 
>(b.pfeifer at d-nb.de), Frau Scheven (e.scheven at d-nb.de 
><mailto:r.heuvelmann at d-nb.de> ), Frau Kubbernuß (a.kubbernuß@d-nb.de)
>	
>
>Schon jetzt herzlichen Dank für Ihre Unterstützung beim Testen 
>und Ihre Rückmeldungen. 
>
>Viel Spaß beim Stöbern wünschen alle in DNB-Beteiligten und besonders
>        Petra Feilhauer, E. Scheven, C. Hengel, B. Pfeifer
>
>		
>
>-- 
>
>Petra Feilhauer
>Deutsche Nationalbibliothek
>Informationstechnik
>Adickesallee 1
>D-60322 Frankfurt am Main
>Telefon: +49-69-1525-1748
>mailto:p.feilhauer at d-nb.de
>http://www.d-nb.de