AW: [rak-list] VIAF - Stand der Dinge?

Hengel-Dittrich, Christina C.Hengel at d-nb.de
Thu Nov 1 17:02:50 CET 2007


Liebe Kolleginnen und Kollegen,

zum Projekt Virtual International Authority File gibt es eine ganze Reihe von Neuigkeiten, die in der nächsten Zeit auf unterschiedlichen Wegen und in einer unter den Projektpartnern abgestimmter Form veröffentlicht werden sollen. Hierzu einige Vorabinformationen:

1. Projekterweiterung
Das VIAF-Projekt, in dem die Library of Congress, die Deutsche Nationalbibliothek und das Online Computer Library Center (OCLC) gemeinsam einen internationalen Authority File aufbauen, ist im Oktober 2007 von den teilnehmenden Institutionen nochmals in einer gemeinsamen Kooperationsvereinbarung bestätigt worden. Als ein weiterer Kooperationspartner ist die Bibliotèque nationale de France in die Kooperation aufgenommen worden. Auch weitere an einer Einbeziehung ihrer Daten interessierten Institutionen werden die Möglichkeit haben, ihre Normdateien in den VIAF einzubringen. Dazu liegt bereits eine Liste von interessierten Nationalbibliotheken vor. 

2. Stand des Projekts
Der VIAF soll die bisher getrennten nationalen und überregionalen Normdateien für Personen, Körperschaften, Geografika, Werke und ggf. weitere Individualbegriffe in einer gemeinsamen (virtuellen) internationalen Normdatei zusammenführen und gleichzeitig zur Unterstützung der Erschließung und zur Endnutzer-Recherche dienen. Bisher sind allerdings erst zwei Personen-Normdateien im VIAF zusammengeführt, die bei der DNB gehaltenen Personennamendatei PND und die an der Library of Congress geführte LC Name Authority File LCNAF, der die Personennormdaten des NACO-Files enthält.
Der Aufbau des ersten VIAF-Prototyps, des Link-Files zwischen PND und LCNAF, ist mittlerweile abgeschlossen. Für den Abgleich wurden die Personennormdaten um Datenelemente aus den jeweiligen zugehörigen Titeldaten erweitert und sogenannte Enhanced Records gebildet. Hierzu wurde der gesamten Titelbestand der Library of Congress und der der Deutschen Nationalbibliothek einbezogen. Nach einer Fülle von vorausgehenden Testverfahren wurden die Enhanced Records gegeneinander abgeglichen, die zusammengehörigen Datensätze (Datensätze, die die selbe Person repräsentieren) nach dem in den Tests erarbeiteten Algorithmus bestimmt und in einem VIAF-Datensatz zusammengeführt. Eine Beschreibung des Verfahrens finden Sie in ... Die so entstandene Datenbank enthält neben diesen zusammengeführten Datensätzen auch alle Datensätze von beiden Seiten, die keinen Treffer gefunden haben oder die nicht hinreichend ähnlich sind, um zusammengeführt zu werden.  
Seit Beginn 2007 wird der VIAF-File von beiden Seiten (LC und DNB) upgedatet, bisher über FTP und noch in monatlichem Rhythmus. Das Verfahren wird zur Zeit auf ein OAI-Verfahren umgestellt. Geliefert werden alle korrigierten, gelöschten und neu eingeführten PND- und LCNAF-Sätze sowie alle korrigierten, gelöschten und neu eingeführten Titelsätze von beiden Seiten, die aber ausschließlich im Rahmen des VIAF verwendet werden dürfen. Austauschformat ist für Titeldaten MARC 21, für PND-Daten US-MARC, ergänzt um lokal vergebene Felder.
 
3. Die nächsten Arbeitsvorhaben
a) Der VIAF soll in der nun beginnenden Projektphase für die Nutzung durch Katalogisierer und später für Endnutzer geöffnet werden. Ein erster Prototyp für ein User-Interface ist von OCLC erstellt worden, und wir sind dabei, es zu testen und Überlegungen zu den notwendigen Funktionalitäten und Einbindungsmöglichkeiten in Katalogisierungs- und Rechercheabläufe anzustellen. 
b) Ab Januar 2008 sollen nach dem bereits erprobten Verfahren die Personendatensätze der BnF in den VIAF integriert werden. Hierzu sind nochmalige Testläufe und Anpassungen der bestehenden Merge-Algorithmen an den neuen Bestand notwendig. 
c) Schon im Juli 2007 wurde mit Tests zur Zusammenführung von Geografika-Datensätzen der SWD und der LCSH begonnen. Hierfür die müssen andere als die für den Abgleich von Personensätzen entwickelten Verfahren gefunden werden, da Titeldaten nur in bestimmten Bereichen identifizierende Zusatzinformationen bieten können. 

Der VIAF wächst sukzessive in die Anwendung hinein, und wir wollen über die Arbeitsvorhaben unter 3. auf dem kommenden Bibliothekartag 2008 schon sehr viel konkreter berichten und präsentieren können.

Beste Grüße
Christel Hengel


-- 
Christel Hengel
Deutsche Nationalbibliothek
Arbeitsstelle für Standardisierung
Arbeitsstelle Normdateien
Adickesallee 1
D-60322 Frankfurt am Main
Telefon: +49-69-1525-1401
Telefax: +49-69-1525-1636
mailto: c.hengel at d-nb.de
http://www.d-nb.de



-----Ursprüngliche Nachricht-----
Von: rak-list-bounces at lists.d-nb.de [mailto:rak-list-bounces at lists.d-nb.de] Im Auftrag von Bernhard Eversberg
Gesendet: Donnerstag, 25. Oktober 2007 13:54
An: Diskussionsliste zum Regelwerk RAK
Betreff: [rak-list] VIAF - Stand der Dinge?


Gibt es etwas Neues zum VIAF-Projekt?
Auf dem D-NB-Server findet man nach wie vor einen undatierten
Projektplan
   http://www.d-nb.de/wir/projekte/viaf_info.htm
und noch immer keinen Fortschrittshinweis.

OCLC hat ja seit einer Weile das "Identities"-Projekt:
http://www.oclc.org/programs/ourwork/renovating/leveragevocab/idresource.htm
(gleichfalls undatiert)
wobei dies mit VIAF wohl eng verquickt ist (der Name wird dort nicht
erwähnt, aber hier: http://www.oclc.org/research/projects/viaf/), denn
erwähnt wird auch, daß "the German national authority file"
eingemischt sei. Welche Datei ist gemeint? PND, GKD oder beide?
Welcher Stand? Wird aktualisiert? Dazu findet man nichts. (Naiv wie man
ist, meint man, D-NB könne ja wenigstens zu den OCLC-Seiten verlinken.
Aber OK, da gibts eine Suchfunktion und man gibt VIAF ein.)

Gleichwohl, "Identities" sieht vielversprechend aus, während man die
Information der D-NB nur "viel versprechend" nennen kann. Von
Körperschaften ist bei D-NB noch nicht die Rede, anders als bei OCLC.

Aber zur Sache.
Mit VIAF verbindet man den oft gehörten Vorschlag, sie solle neben
der LC-Form eines Namens die unterschiedlichen Formen anderer
Agenturen umfassen und es ermöglichen, daß von der Suche in der VIAF
(oder eben in "Identities") ein weltweites Weiterschalten in
Kataloge der verschiedensten Sprachbereiche erfolge, jeweils mit der
dann "richtigen" Namensform.
Daran kommen mir langsam doch Zweifel. Erheblich leichter zu
organisieren scheint mir jetzt, daß das Weiterschalten stets mit
der fest etablierten LC-Namensform geschehe und die nationalen
Normdaten jeweils über ihre eigenen Formen hinaus stets die
LC-Form als eine der Verweisungen enthalte - was bei der PND
ja auch in einigem Umfang schon der Fall ist. Einen Schritt weiter-
gedacht: Besser als die LC-Namensform wäre zusätzlich die
IdNummer des LC-NAF-Satzes. Diese ist, soweit ich sehe, in den PND-Daten
noch nicht vorhanden, jedenfalls nicht in der GBV-Ausprägung.
Geeignete Indexierung vorausgesetzt, könnten dann grenzüberschreitende
Abfragen mittels der LC-Form stattfinden, aber auch direkte Abfragen
wären unter der LC-Form immer möglich, ohne also vorher immer die VIAF
konsultieren zu müssen - auch nicht unter der Oberfläche, was ja nicht
bei jedem System leicht realisierbar und auch nicht schnell wäre.
Das Updating in beiden Richtungen sollte sich damit wohl auch leichter
und sicherer organisieren lassen.
Noch leichter wird freilich alles, wenn wir zur Arbeitssprache Englisch
übergehen und die RAK-Formen auf sich beruhen lassen. Noch scheint es
dafür keine Mehrheit zu geben...
Vielleicht sind all diese teilweise ja naheliegenden Dinge längst
erörtert und entschieden, aber wo steht das? Wer weiß es? Wann erfährt
man es?

MfG B.E.

N.B.
Mit der unerfreulicherweise fehlenden Datierung auf vielen Seiten ist
die D-NB nicht allein, das wird vielerorts so gehalten. Im Quelltext
steht aber immerhin
<meta name="DC.date" content="2006-06-09" />




_______________________________________________
rak-list mailing list
rak-list at lists.d-nb.de
http://lists.d-nb.de/mailman/listinfo/rak-list


More information about the rak-list mailing list