[Gnd-ag-os-wds] WG: Rückmeldung FID Osteuropa / Sprachredaktion an der BSB zur Relevanz des Sprachencodes beim Export aus der GND

Diedrich, Andrea Andrea.Diedrich at gbv.de
Di Dez 20 11:04:23 CET 2022


Liebe Frau Erfurth, liebe Kolleginnen und Kollegen,
ich habe gerade gesehen, dass die Antwort von Herrn Aigner vom 12. Dezember nur an mich ging und nicht an die Liste.
Daher leite ich Sie Ihnen zur Meinungsbildung ebenfalls weiter.
Herzliche Grüße
Andrea Diedrich

Von: Sebastian Aigner <sebastian.aigner at obvsg.at>
Gesendet: Montag, 12. Dezember 2022 17:00
An: Diedrich, Andrea <Andrea.Diedrich at gbv.de>
Betreff: Re: [Gnd-ag-os-wds] Rückmeldung FID Osteuropa / Sprachredaktion an der BSB zur Relevanz des Sprachencodes beim Export aus der GND

Liebe Frau Diedrich,

ich konnte krankheitsbedingt letzte Woche leider nicht teilnehmen, möchte mich aber dennoch gerne an der Diskussion beteiligen. Ich weiß nicht genau, worüber sie am Mittwoch gesprochen haben, kenne also die genau Stoßrichtung Ihrer Frage nicht, ich nehme aber an, dass es um die Einbeziehung des Sprachencodes beim Zusammenführen des Namens des Geistigen Schöpfers mit dem Titel geht.

Gleich vorweg, ich bin ganz Ihrer Meinung, dass es durchaus mehrere 7XX mit gleicher Schriftmarkierung geben kann!


Bspw. Feld 700 ist in der Formatbeschreibung dokumentiert als

“Bevorzugter Name einer Person in einem anderen Datenbestand. Das Feld 'Bevorzugter Name in einem anderen Datenbestand' umfasst auch Namen in nichtlateinischer Schrift - sowohl bevorzugte Namen in nichtlateinischer Schrift aus anderen Datenbeständen als auch solche, die gemäß Vorlageform gebildet werden.”

Die Formulierungen in den anderen 7XX-Feldern sind sinngleich.

Es können also ganz prinzipiell Namen/Benennungen in allen möglichen Schriften/Sprachen eingegeben werden. Einschränkungen auf die Originalschrift bzw. –sprache eines Autors, einer Körperschaft etc. gibt es nicht.

Bei den Inhalten von 7XX handelt es sich also einerseits um „Importe“ (maschinell eingespielt oder intellektuell übertragen) der 1XX (=BN) anderer Normdatenbanken und andererseits um die intellektuell eingegebenen Vorlageformen, deren Transkription in lateinische Schrift die 1XX des GND-DS ergibt.

Schon hier ist, meiner Meinung nach, nicht hundertprozentig klar, ob nicht für eine Entität beides vorhanden sein könnte, es also für eine Entität mehrere 7XX geben könnte, die die gleiche Schriftmarkierung tragen, auch wenn die Schrift „eindeutig“ ist.

Bspw. eine, die aus einer griechischen Normdatenbank kommt und demnach als griechisch markiert ist (gebildet nach den dort gültigen Regeln) und eine weitere 7XX, die die griechische Entsprechung jenes Namens ist, der in seiner transkribierten Form gemäß unserem Regelwerk als 1XX für die GND gewählt wurde. In den meisten Fällen würden die beiden Formen wohl ident sein, das kann aber, aufgrund unseres gültigen Regelwerkes und der Regelungen bzgl. Rangfolge der Quellen und in Unkenntnis der einzelnen Regelungen zur Bestimmung des bevorzugten Namens, die für diverse andere Datenbestände relevant sind, nicht als gegeben angenommen werden. Dies ist aber wohl eher nur ein theoretisches Problem, wären doch alle Kombinationen aus Personenname und Titel in diesen Fällen zumindest sprachlich korrekt.

Unzweifelhaft mehrere 7XX mit gleichem Schriftcode kann es aber, meiner Ansicht nach, jedenfalls dort geben, wo ein und dieselbe Schriftcodierung in MARC 7XX bzw. 4XX $9 U: für unterschiedliche Sprachen verwendet wird. Nun kann man vermutlich auf inhaltlicher Ebene sicherlich darüber diskutieren, ob bspw. russisches und ukrainisches oder serbisches Kyrill tatsächlich dieselbe Schrift sind, weichen doch die Alphabete voneinander ab, bezogen auf unsere Codierungen sind sie es aber definitiv, tragen sie doch alle den Code „Cyrl“.

Wir könnten bspw. neben der mit MARC 700 $9 v:Original gekennzeichneten serbischen Namensform im GND-DS eines serbischen Schriftstellers auch eine 700 mit der russischen, eine weitere mit der ukrainischen und noch weitere in Nordmazedonisch, Belarussisch etc. finden. All diese Formen tragen $9 U:Cyrl. Eine Unterscheidung ist erst durch $9 L: möglich.

Gibt es dann auch einen Werknormdatensatz für eines seiner Werke könnten auch dort wieder die Titel in allen oben angeführten Sprachen in diversen PICA 730 vorhanden sein und eine korrekte „Montage“ zum Datentausch in MARC 700 wäre nur unter Einbeziehung des Sprachcodes möglich.

Auch wenn es jeweils nur eine mit „Cyrl“ gekennzeichnete Namensform beim Autor und eine beim Werktitel gibt, ist nicht zwingend gesagt, dass diese zusammenpassen, wenn es keine Sprachmarkierung gibt oder diese nicht ausgewertet wird. Es könnte sich um die Namensform der bspw. sowjetischen Person aus den Authorities der Russischen Nationalbibliothek handeln oder meinetwegen auch um die manuell eingegebene Vorlageform, genommen von einer Russischen Ausgabe eines der Werke der Autor_in, wohingegen der Titel des Werkes aus bspw. der vorliegenden Übersetzung ins Weißrussische stammt …

Sehr oft wird eines der oben angeführten Szenarien sich natürlich derzeit nicht in unseren Daten finden, aber mit zunehmender Vernetzung von Daten kann das durchaus relevant werden und außerdem denke ich, muss unsere Modellierung – unabhängig vom derzeitigen Datenbestand – formattechnisch einfach korrekt sein.

Ich bin deshalb, wie schon bei den letzten Telkos gesagt, also der Meinung, dass wir neben MARC 7XX/4XX $9 U: unbedingt auch $9 L: auswerten müssen!

Mit freundlichen Grüßen
Sebastian Aigner


________________________________________________________

Sebastian Aigner
Die Österreichische Bibliothekenverbund und Service GmbH
A-1020 Wien, Raimundgasse 1/3
Tel.: +43/1/403 51 58-63
E-Mail: sebastian.aigner at obvsg.at<mailto:sebastian.aigner at obvsg.at>
Diedrich, Andrea <andrea.diedrich at gbv.de<mailto:andrea.diedrich at gbv.de>> hat am 09.12.2022 14:17 CET geschrieben:



Liebe Frau Erfurth,



beim Schreiben des Protokollentwurfs für unser Treffer am Mittwoch haben sich Frau Feuerstein und ich uns noch einmal mit Ihrer Mail beschäftigt und es stellt sich uns folgende Frage:


Stimmt denn diese gelb markierte Aussage so? Wenn ja, wo ist das belegt?

[grafik.png]<https://matrix.gbv.de/_matrix/media/r0/download/gbv.de/vUwYpPMItRgQPnScOgUuuzMJ>

Mehrere Felder 700 in einem Datensatz sind ja möglich, nur eben nur eines mit $vOriginal. Wir hatten bei der Sitzung gestern besprochen, dass alle 7XXer-Felder exportiert werden sollen, nicht nur das mit $vOriginal.
Darf wirklich jeder Schriftcode nur einmal in 7XX vorkommen? Es steht eigentlich explizit in der EH-A-09 diese Information:

[grafik.png]<https://matrix.gbv.de/_matrix/media/r0/download/gbv.de/vCokxhEwGsPorJhMWMVvLVDx>

Es sollte doch eigentlich korrekt möglich sein, in den Feldern 700 im Tp-Satz und 730 im Tu-Satz (in PICA) im Fall von ukrainischem und russischem Kyrillisch beides zu erfassen. Dass nur eine Kennzeichnung mit $vOriginal möglich ist, ist unstrittig.

Gespannt auf Ihre Antwort wünschen wir einen schönen dritten Advent

Andrea Diedrich und Annabel Feuerstein





-----Ursprüngliche Nachricht-----
Von: Gnd-ag-os-wds <gnd-ag-os-wds-bounces at lists.dnb.de<mailto:gnd-ag-os-wds-bounces at lists.dnb.de>> Im Auftrag von Christine Erfurth
Gesendet: Montag, 21. November 2022 11:47
An: gnd-ag-os-wds at lists.dnb.de<mailto:gnd-ag-os-wds at lists.dnb.de>
Betreff: [Gnd-ag-os-wds] Rückmeldung FID Osteuropa / Sprachredaktion an der BSB zur Relevanz des Sprachencodes beim Export aus der GND



Liebe Kolleginnen und Kollegen,



mir liegt die Rückmeldung unserer Sprachredaktion an der BSB aus dem FID Osteuropa vor:



Laut den KollegInnen sollte für die Fälle 2 und 3 der übereinstimmende Schriftcode $UCyrl grundsätzlich ausreichen, wenn die 7XX-Felder im Personennormsatz korrekt eingetragen sind. Zwei Fälle sollten bedacht werden:



1. Übereinstimmung von Schriftcode $U und Sprachcode $L ist vermutlich zwingend in Fällen fehlerhafter Mehrfachbelegung von 7XX$UCyrl mit verschiedenen $L. Korrekt wäre immer nur ein 7XX-Feld mit $UCyrl. Weitere Formen müssten in 4XX eingetragen werden.



Beispiele:   (DE-588)118641816 Puškin, Aleksandr Sergeevič

                    Korrektes Feld 700 $UCyrl $Lrus  $pПушкин, Александр Сергеевич $vOriginal

                    Falsches Feld 700 $UCyrl $Lxal $pПушкин, А. С.



                   (DE-588)11864291X Tolstoj, Lev Nikolaevič

                   Korrektes Feld 700 $UCyrl $Lrus  $pТолстой, Лев Николаевич $vOriginal

                   Falsches Feld 700 $UCyrl $Lukr $pТолстой, Лев Миколайович



Alternativ müsste es vorab eine Korrektur der Daten geben und die Neueingabe von falschen 7XX-Feldern verhindert werden.



2. Schriftsteller, die in verschiedenen Sprachen publizier(t)en, z.B. Originale in Russisch wie auch uUkrainisch



Hier wäre eine Abweichung der Sprachencodes zulässig, solange der gemeinsame Nenner der Schriftcode $UCyrl ist.

Die Person hätte möglicherweise Sprachencode $Lukr, das Werk aber korrekt Sprachcode $Lrus.



Sonderfälle: z.B. Russische/Ukrainische ... Emigranten, die russisch wie auch hebräische publizier(ten).



Viele Grüße

Christine Erfurth





***********************************************

Dr. Christine Erfurth

Bayerische Staatsbibliothek

Bestandsentwicklung und Erschließung 1

Referat: Länder- und Fachreferate

Sachbereich Normdaten

Ludwigstraße 16

D-80539 München

Tel.: +49 89 28638-2833

Fax: +49 89 28638-2309

***********************************************







--

Gnd-ag-os-wds mailing list

Gnd-ag-os-wds at lists.dnb.de<mailto:Gnd-ag-os-wds at lists.dnb.de>

https://lists.dnb.de/mailman/listinfo/gnd-ag-os-wds
--
Gnd-ag-os-wds mailing list
Gnd-ag-os-wds at lists.dnb.de<mailto:Gnd-ag-os-wds at lists.dnb.de>
https://lists.dnb.de/mailman/listinfo/gnd-ag-os-wds
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://lists.dnb.de/pipermail/gnd-ag-os-wds/attachments/20221220/00b2970b/attachment-0001.htm>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : image001.png
Dateityp    : image/png
Dateigröße  : 25034 bytes
Beschreibung: image001.png
URL         : <http://lists.dnb.de/pipermail/gnd-ag-os-wds/attachments/20221220/00b2970b/attachment-0002.png>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : image002.png
Dateityp    : image/png
Dateigröße  : 70198 bytes
Beschreibung: image002.png
URL         : <http://lists.dnb.de/pipermail/gnd-ag-os-wds/attachments/20221220/00b2970b/attachment-0003.png>


Mehr Informationen über die Mailingliste Gnd-ag-os-wds