AW: AW: [rak-list] Re: Aus der 10. Sitzung des STA (Teil 2)

Hengel-Dittrich, Christina hengel at dbf.ddb.de
Tue Jun 7 11:52:16 CEST 2005


Liebe Frau Wiesenmüller, liebe Kolleginnen, liebe Kollegen,
dem Beispiel von Frau Wiesenmüller folgend, füge ich meine Diskussionsbeiträge unten in ihren Text ein. Um dabei Winkelklammer-Salat zu vermeiden, habe ich die einzelnen Absätze und meine Kommentare dazu durchnummeriert. 
Beste Grüße 
Christel Hengel 
 

-----Ursprüngliche Nachricht-----
Von: owner-rak-list at ddb.de [mailto:owner-rak-list at ddb.de] Im Auftrag von Heidrun Wiesenmueller
Gesendet: Montag, 6. Juni 2005 08:42
An: rak-list at ddb.de
Betreff: Re: AW: [rak-list] Re: Aus der 10. Sitzung des STA (Teil 2)

Liebe Frau Hengel,
liebe Kolleginnen und Kollegen,

zunaechst ganz herzlichen Dank fuer die ausfuehrliche Antwortmail vom 3. 
Juni! Auch die lebhafte Diskussion der vergangenen Tage in der Liste fand ich erfreulich; es waere schoen, wenn es so sachlich und konstruktiv weiterginge.

>Wir wollen international kompatible Daten herstellen, mit denen unsere 
>Benutzer nicht nur in unseren Beständen, sondern über Datennetze 
>weltweit recherchieren können, und dies komfortabel, schnell und gezielt.
(...)
>Die dafür notwendigen Umstellungen werden nicht zum Nulltarif zu haben 
>sein - genauso wenig wie die Einführung der Datenverarbeitung in 
>Bibliotheken einmal kostenlos war - , sie werden aber die Angebote der 
>Bibliotheken entscheidend verbessern, die Katalogisierung durch das 
>verstärkte "Teilen" und "Nachbauen" von Datensätzen rationalisieren und 
>sie auch inhaltlich verändern.

1) Ich habe gewisse Zweifel, ob man die jetzige Situation mit der EDV-Einfuehrung vergleichen kann: Zum einen, weil diese Umstellung unter ganz anderen finanziellen und personellen Rahmenbedingungen vor sich ging. 
Zum anderen, weil man zwar mit dem Katalogbruch einen schmerzhaften Schritt tun musste, jedoch als Lohn eine wirklich dramatische Verbesserung sowohl fuer Bibliothekare wie auch Benutzer winkte. Eine aehnlich durchschlagende Aenderung kann ich bei einem Umstieg auf AACR3/RDA nicht erkennen.

Zu 1) 
Die Ablösung der Paris Principles durch einen neuen "International Cataloging Code", die gerade vonstatten geht, ist ein deutlicher Hinweis auf die Parallelität. Die Zukunft der Bibliotheken liegt im Web. Es gilt zu organisieren, dass Benutzer mit ihrer jeweiligen Suchsprache und ohne Vorkenntnis von bibliothekarischen Regeln verteilt gehaltene Medien und Informationen suchen und benutzen können. Die Regeln, nach denen erschlossen wird, und die Erschließungsinstrumente wie Normdateien, Klassifikationen, vereinbarte Codes etc., die dabei verwendet werden, müssen international zueinander passen und Umstiegsmöglichkeiten zwischen den Erschließungsinstrumenten vorsehen. 

2) Vielmehr ist fuer mich bisher noch immer nicht ueberzeugend belegt, dass die RAK fuer unsere Nutzer tatsaechlich ein nennenswertes Recherchehindernis darstellen. Die Ausfuehrungen dazu waren immer recht allgemein - vielleicht koennte man das einmal anhand realistischer wissenschaftlicher Bedarfsszenarien und konkreter Recherchebeispiele verdeutlichen?

Zu 2)
Die RAK in der heute vorliegenden Form bieten an vielen Stellen Recherchehindernisse, z.B. bei den sich widersprechenden Sonderregeln, z.B. bei abweichenden Ansetzungsformen in Formal- und Sacherschließung, z.B. in Ansetzungs- und Verweisungsregeln, die die Angabe des Namens einer Körperschaft in unveränderter Form regelrecht verbieten. Aber selbst wenn dies nicht so wäre, ist eine internationale Abstimmung notwendig.
Deutsche Erschließungsregeln in einer weiterentwickelten, international vereinbarten Form soll und muss es geben.  

3) Vernetzung ist natuerlich zu Recht ein grosses Thema. In Baden-Wuerttemberg beispielsweise gibt es Plaene fuer ein landeskundliches Informationssystem, das institutions- und medienuebergreifend Datenangebote vernetzen soll (neben den Landesbibliotheken sind u.a. Landesarchiv, Landesdenkmalamt, Landesmedienzentrum, Statistisches Landesamt und Landesvermessungsamt beteiligt). Das sind wirklich hochgradig heterogene Datenbestaende, deren Vernetzung anspruchsvolle technische Loesungen erfordert. Im Vergleich dazu sind - wie mir scheint - die Unterschiede zwischen zwei bibliothekarischen Regelwerken wie RAK und AACR nahezu vernachlaessigbar.

Zu 3)
Die Aussage ist zwar banal, aber trotzdem richtig und für große Datenbestände besonders wichtig, dass die Recherche in heterogen erschlossenen Datenbeständen die besten Ergebnisse hat, wenn die Abweichungen in den zur Erschließung verwendeten Standards möglichst gering sind, die Entitäten und die zur Beschreibung verwendeten Elementtypen übereinstimmen.  

>Die Beziehungen, die wir als über-/untergeordnete Titeldatensätze 
>darstellen, sind i.d.R. Ganzes-Teil-Beziehungen. Die Probleme, die 
>dabei aufgetreten sind, sind einerseits Austauschprobleme aufgrund 
>unterschiedlicher Hierarchiestufen-Zuschnitte, andererseits Probleme im 
>Retrieval und im Austausch aufgrund der Unvollständigkeit der 
>Datensätze auf den jeweiligen Hierarchiestufen.
>Diese Probleme lassen sich sicherlich lösen, es spricht aber doch sehr 
>vieles für vollständige Datensätze, die alle für die Benutzerrecherche 
>und den Datentausch notwendigen Informationen enthalten, und für eine 
>Reduktion der Hierarchiestufen.

4) Fuer mich ist das primaer eine technische Frage. Unser bisheriges System ist dahingehend sehr effizient, als es kaum Redundanzen in der Datenhaltung gibt; dafuer ist vielleicht der technische Aufwand bei Austausch und Recherche wirklich etwas hoeher. Da Speicherplatz heute kein ernstzunehmender Kostenfaktor mehr ist, spricht in der Tat nichts dagegen, Informationen aus dem uebergeordneten Satz in den Untersaetzen zu wiederholen. Ein Kompromiss nach Art der Schweizer Loesung (weiterhin hierarchische Saetze, aber Untersaetze mit erweiterten Informationen) waere deshalb fuer mich ein durchaus gangbarer Weg.

>Zum "Mehraufwand" des FRBR-Konzepts: für neue Werke ist der Aufwand 
>gleich, bei der Nachnutzung für die nächste expression bzw. 
>manifestation sinkt der Aufwand. Für bereits vorhandene Werke würde bei 
>durchgehender intellektueller Bearbeitung allerdings Mehraufwand 
>entstehen. So kann eine rückwirkende "Ferberisierung" wahrscheinlich 
>nur über automatische Verfahren, intellektuell nur in sehr wichtigen Einzelfällen erfolgen.

5) Eine Schwierigkeit bei der FRBR-Thematik ist sicher, dass sich derzeit kaum jemand genau vorstellen kann, wie sie in der Praxis umgesetzt werden soll. 
Dass der Aufwand bei neuen Werken nicht hoeher sein wird als heute, kann ich mir allerdings nur schwer vorstellen. Muesste man nicht in jedem Fall zunaechst - mit entsprechenden Rechercheaufwand - verifizieren, dass wirklich ein "neues" Werk vorliegt, welches keinerlei (FRBR)-Bezuege zu etwas schon Vorhandenem aufweist?

Zu 5)
Für Nationalbibliotheken und regionale Pflichtexemplarbibliotheken wäre das eine ohne manuellen Mehraufwand zu bewältigende Aufgabe.

>Zu 3: Neben den Entitäten müssen auch die zur Identifizierung und 
>näheren Beschreibung herangezogenen Datenelemente übereinstimmen, was 
>eng mit den Zuschnitten der Entitäten zusammenhängt, aber - in jetziger 
>Terminologie - auch mit der Ansetzungsform. Wann wird der Sitz der 
>Körperschaft, das Land, die Region, der Staat, die zeitliche Zuordnung etc. angegeben?

6) Das hatte ich nicht auf Anhieb verstanden. Denn wenn sich das gesamte Entitaetensystem 1:1 entspraeche, waere es wirklich egal, aus welchen Datenelementen es sich definiert. Gemeint ist wohl, dass sich aus unterschiedlichen Beschreibungselementen eben auch unterschiedliche Entitaeten ergeben, diese also ein Hindernis bei der Entitaetenangleichung sind.

Beispiel:
"Koninklijke Bibliotheek <'s-Gravenhage>" (GKD) "Koninklijke Bibliotheek (Netherlands)" (LOC)

Die Entitaet ist  (trotz unterschiedlicher Datenelemente) identisch und daher eine Verknuepfung a la VIAF unproblematisch. Wuerde jetzt aber beispielsweise die Koninklijke Bibliotheek nach Amsterdam umziehen, gaebe es in der GKD einen Split, in LOC aber nicht. Eine Angleichung der Entitaeten ist also leichter gesagt als getan.

Zu 6)
Vermischt werden in den RAK-Ansetzungen für ortsgebundene Körperschaften, wie Sie richtig sagen, nicht die Entitäten, sondern die Datenelemente "Name der Körperschaft" und "Ortssitz der Körperschaft".
Ortsgebundene Körperschaften sind ein schönes Beispiel, warum es nicht egal ist, wenn Datenelemente nicht separat von einander angegeben werden oder wenn unterschiedliche Elementtypen zur Beschreibung verwendet werden: 

Die Vermischung von Ortsnamen und Körperschaftsnamen bedeutet die Kreation eines Kunstnamens, der sich nach eigenen Regeln ändert, wenn sich der Name eines der beiden Bestandteile ändert. Dieser Kunstname ist auch nicht in allen Fällen dem Benutzer 
geläufig und für die Recherche geeignet.
Durch die separate Angabe von Körperschaftsnamen und Ortsnamen erreicht man, dass der Name der Körperschaft klar definiert ist und der Ort als Sitz der Körperschaft, durch den die K. näher definiert wird, getrennt verwaltet, geändert und auch gesucht werden kann. Die Ortsangabe bei Körperschaften ist in allen drei Normdateien eine versteckte Relation, denn in der Regel steht hinter jeder Ortsansetzung wiederum ein eigener Körperschaftssatz. 
Abweichungen in den Elementtypen haben Konsequenzen für die Recherchemöglichkeiten: In der einen Normdatei kann man die Bibliothek über ihren Ortssitz ermitteln (z.B. mit einer Suchfrage "finde alle Bibliotheken in Den Haag mit der Gattungsbezeichnung Nationalbibliothek"), in der anderen Normdatei über den zugehörigen Staat ("finde die Nationalbibliothek(en) des Staates Niederlande"). Bei einer übergreifenden Suche bliebe eine der beiden Suchfragen ohne Antwort, obwohl ein logischer Treffer vorhanden ist.  


7) Aber: Muss es wirklich eine 100-Prozent-Uebereinstimmung werden? Ich denke, man koennte auch mit etwas weniger zufrieden sein, zumal sich vieles mit technischen Methoden ausgleichen laesst (im beschriebenen hypothetischen Fall z.B. durch Abbildung des LOC-Satzes auf beide GKD-Saetze). Dafuer wuerden wir uns viel Arbeit bei der Umarbeitung der GKD und beim Umhaengen von Titeln sparen.

Zu 7)
Beim Zusammenführen von Entitäten kann man Korrekturen automatisch durchführen. Ungleich schwieriger sind nachträgliche Splits herzustellen. Allerdings kann das Fehlen von Differenzierungen für eine übergreifende Recherche hinderlich sein, wie sehr hängt vom jeweiligen Fall ab. Wir sind im Moment im GKR-Projekt an der Zusammenstellung einer Übersicht über die Entitätenzuschnitte nach den RAK-WB, den RSWK und den AACR2 - was sehr aufwändig ist und wofür ich mich bei allen Beteiligten herzlich bedanke - und werden die Ergebnisse gemeinsam mit der Projektgruppe für die beteiligten Expertengruppen aufbereiten.   

>Wir haben außerdem auch die Zusammenführung der Körperschaften der 
>Sacherschließung und der Formalerschließung zum Ziel - kein Benutzer im 
>Internet sucht Körperschaften getrennt nach FE und SE -,

8) Ich aergere mich auch jedesmal, wenn ich einen vorhandenen GKD-Satz fuer die SWD umschreiben muss - das ist wirklich unnoetig wie ein Kropf! Aber auch hier moechte ich fuer Pragmatismus plaedieren und einige etwas "ketzerische" Thesen zum Thema Koerperschaftsschlagwoerter aufstellen:

These 1: Interpunktionszeichen und Wortfolge sind fuer die Benutzer irrelevant.

Beispiel:
"Stadtarchiv <Duesseldorf>" (GKD)
"Duesseldorf / Stadtarchiv" (SWD)
"Stadtarchiv Duesseldorf" (LOC)

In der Standard-Recherchesituation (Stichwortindex) sind alle drei Formen voellig gleichwertig: Die Interpunktionszeichen werden vom Benutzer ohnehin als blosse Schreibkonvention aufgefasst (auch wenn dahinter unterschiedliche theoretische Konzepte stehen). Die Abfolge der Woerter waere nur bei einem Phrasenindex von Bedeutung; da koennte man sich dann aber mit Permutationen behelfen.

Zu 8. These 1: 
Was Sie hier gegenüberstellen, sind die unterschiedlichen Anzeigeformen, die aus stark abweichenden Erfassungs- und Austauschformaten abgeleitet sind. (Die Anzeigeform für die SWD-Ansetzung müsste dabei übrigens m.E. "Düsseldorf / Stadtarchiv Düsseldorf" lauten.) Die Interpunktionszeichen in der Anzeigeform sind auch meiner Meinung nach beliebig, nicht aber die dahinterstehende Erschließungsstruktur für Körperschaftsnamen und Ortsnamen.
 
These 2: Fuer die Benutzer ist nicht wichtig, welche Ansetzungsform in ihrem Rechercheergebnis angezeigt wird, sondern nur, mit welchen Formen sie suchen koennen.

Wenn ein Benutzer mit der Eingabe "Koenigliche Bibliothek Den Haag" zum Ziel kommt, wuerde es ihn m.E. nicht stoeren, wenn beim Titel stattdessen "Koninklijke Bibliotheek <'s-Gravenhage>" angezeigt wuerde - eine solche Transferleistung duerfen wir unseren Benutzern schon zumuten!

Zu 8. These 2: 
Wir erwarten das von unseren Normdaten-Benutzern eigentlich jetzt schon durchgehend, wenn er mit Verweisungsformen sucht. 
(Der Benutzer kann dabei allerdings im Einzelfall durchaus irritiert werden, weil transliterierte Formen doch häufig eklatant anders aussehen. Die Anzeige der jeweils gesuchten Form hätte auch ihren Charme, ist aber bestimmt ungleich schwieriger.) Für deutsche Namensformen spricht, dass wir im internationalen Kontext für die im Deutschen übliche Erschließung und Recherche zuständig sind. Allerdings haben wir im Deutschen einen eindeutigen Trend zu originalsprachigen Formen - soweit keine entlegenen Sprachen und Schriften involviert sind und keine eingeführten deutschen Exonyme vorhanden sind. 

These 3: Die Verwendung von originalsprachlicher bzw. deutschsprachiger Form ist der einzige wirklich suchrelevante Unterschied in GKD- und SWD-Ansetzungen von Koerperschaften.

Die einfachste und effektivste Loesung waere es daher doch, die vorhandenen GKD-Saetze um deutschsprachige Formen aus der SWD zu ergaenzen (sofern diese nicht sowieso schon als Verweisungsform im GKD-Satz stehen) und das Konglomerat dann als Grundlage fuer die Formal- _und_ die Sacherschliessung zu verwenden. Ich glaube, dass man eine solche Zusammenfuehrung weitgehend maschinell erreichen koennte. In unserer Landesbibliographie-Datenbank wurden uebrigens Koerperschaftsschlagwoerter von Anfang an (seit Mitte der 1980er Jahre) nach der GKD angesetzt, und es hat sich noch nie jemand darueber beschwert ;-)

Die GKD ist unsere aelteste und bewaehrteste Normdatei; mit viel Aufwand hat man einen umfangreichen, in sich stimmigen und sehr qualitaetvollen Datenpool erarbeitet, der den Titelaufnehmern die taegliche Arbeit ungemein erleichtert. Deshalb macht mir die Vorstellung, die GKD grossraeumig in Richtung RFD/AACR3 umzuarbeiten, schon einige Bauchschmerzen. Wieviel davon automatisiert erfolgen koennte, weiss ich nicht - fuerchte aber, dass viele Arbeiten nur intellektuell zu erledigen sind (wobei es nicht nur um die Normdaten selbst geht, sondern zum Teil auch um die damit verknuepften Titeldaten). Womoeglich muessten unsere Katalogisierer auf Jahre hinweg bei jedem verwendeten GKD-Satz ueberpruefen, ob er schon auf dem neuen Stand ist, und ihn noetigenfalls umarbeiten. Wenn man sich dann noch vor Augen haelt, dass sich wohl die meisten Aenderungen auf Interpunktionszeichen oder das Vertauschen von Ansetzungs- und Verweisungsform beschraenken werden (also nicht rechercherelevant sind), dann fragt man sich schon, ob der Aufwand gerechtfertigt sein kann.

Zu 8. These 3: 
Zusätzlich zur Sprachform gibt es einige weitere Abweichungen zwischen GKD- und SWD-Ansetzungen, bei Vororten, bei der Ansetzung von Geografika überhaupt, bei Normierungen etc.. 

Zur Vorgehensweise: In der Tat ist die Zusammenführung von SWD-Körperschaften und GKD-Körperschaften in gemeinsamen Normdatensätzen unsere im GKR-Projekt und darüber hinaus anvisierte Zielsetzung. (Manueller Nachbearbeitungsaufwand in Titeldaten soll dabei nach Möglichkeit vermieden werden, und auch bei den Normdatensätzen sprechen die Größenordnungen gegen manuelle Verfahren.)
Dabei wollen wir die Kompatibilität zu LCNA und RDA wahren, insbesondere was Entitätenzuschnitte, Datenelemente und Relationen betrifft (vgl. oben). Abweichungen in den Namensformen sind m.E. nicht wirklich gravierend, solange sie über Verweisungen abgedeckt sind, aber andererseits gibt es auch keinen Grund, unnötige Abweichungen auf Regelwerksebene festzuschreiben. 
Die zwei wesentlichen Zielsetzungen bei den Körperschaftsregeln, die für uns eigentlich an erster Stelle stehen und die wir gemeinsam mit den deutschen Experten in der RDA-Entwicklung unterstützen wollen, richten sich darauf, die Eignung der Körperschaftssätze für die Recherche zu verbessern und  gleichzeitig damit die Ansetzungs- und Verwendungsregeln entscheidend zu vereinfachen.
  
>Zu 4: Wir werden in den Normdateien beträchtliche Anstrengungen 
>unternehmen, damit die Normdaten nach einer Regelwerksumstellung 
>"abwärtskompatibel" bleiben. Damit werden die Hauptsucheinstiege ohne 
>gravierende Brüche gewährleistet bleiben.

9)Das waere natuerlich eine gute Sache! Koennten Sie, liebe Frau Hengel, noch etwas naeher erlaeutern, wie man es sich im Detail vorzustellen hat?

Zu 9)
Wir machen uns gerade daran, diese Details gemeinsam mit den Experten und den Normdatenpartnern zu entwickeln. Dazu haben wir bisher zwei Projekte begonnen, das schon erwähnte Projekt "Entwicklung Gemeinsamer Ansetzungsregeln für Körperschaften" (GKR-Projekt) und ein zweites Projekt "Entwicklung eines Gemeinsamen Körperschaftsformats" (GND-Projekt). In beiden Projekten werden von einer kleinen Arbeitsgruppe mit Vertretern aus den beteiligten Expertengruppen bzw. Verbünden die Problembereiche - z.B. Entitäten, z.B. Sprachfrom des Namens, z.B. separate (Unter-)Felder für Datenelemente - inhaltlich vorbereitet und in den Expertengruppen zur Diskussion und Beschlussfassung vorgelegt. Die Experten sind dabei aufgefordert, auch die Diskussion in den Verbünden anzustoßen und zu organisieren, und AfS hat sich vorgenommen, möglichst breit zu informieren. Wir wollen auf diese Weise das zukünftige deutsche Regelwerk und unseren Beitrag zur RDA-Entwicklung auf eine möglichst breite Basis stellen, wollen aber gleichzeitig lange Übergangszeiten vermeiden und streben deshalb eine möglichst zügige Entwicklung innerhalb des vom JSC abgesteckten Zeitrahmens an.






More information about the rak-list mailing list