[gnd] Antw: Anzahl der veränderten Normdatensätze während des M&M-Tests vom 28. Juni

Angela Bernhardt bernhardt at bsb-muenchen.de
Die Jul 3 08:40:55 CEST 2012


Lieber Herr Grund, 

wie bereits Frau Tölle meldet, haben wir auch ein Problem mit der großen Zahl der Updates. 
1) Innerhalb der GND-Datei selber:  
Wir spielen mit dem Gedanken auf die GND-Updates in den lokalen Systemen zu verzichten. Das bedeutet für uns sehr viel Aufwand und eine genaue Koordinierung zw. Ihre Aktionen und die Abläufe bei uns, ansonsten blockiren wir den ganzen Betrieb sowohl im Verbund als auch bei den Lokalsystemen.

2)Titeländerungen: 
Auf was wir jedoch NICHT verzichten können sind die Titeländerungen, sie MÜSSEN bis zu den Lokalsystemen transportiert werden. 
Für die 1.748 GND-Sätze haben wir bei uns mit Schrecken entdeckt, dass wir  
in der produktiven Datenbank 396.815 Titelverknüpfungen insgesamt haben. Obwohl wir nicht ermitteln können wie viele Titelsätze verk. mit der GND-gewinner-ID geändert werden, können wir diese Anzahl Änderungen nicht  "überleben". 


Hier sind unseren Untersuchungen für das Packet mit 1748 Datensätzen (siehe ID-Anhang links Gewinner, rechts Verlierer):

GND-IDs im Kontingent:
    1747 m_6_11_gewinner
    1747 m_6_11_verlierer
    3494 total

Titelverknüpfungen:
  385006 s_6_11_gewinner
   11809 s_6_11_verlierer
  396815 total

GND-IDs mit Titelverknüpfung:
    1652 u_6_11_gewinner
     950 u_6_11_verlierer
    2602 total

Auf Grund der ermittelten Zahlen sehen wir keine Möglichkeit, das Verfahren in dem geplanten Umfang einzusetzen. 

Viele Grüße
Angela Bernhardt  
 


---------------------------------------
Bayerische Staatsbibliothek
Bibliotheksverbund Bayern / Verbundzentrale
Verbundnahe Dienste
D-80539 München

Tel:    +49 (0) 89 28638-2626
Fax:    +49 (0) 89 28638-2605 
eMail: Angela.Bernhardt at bsb-muenchen.de
 
 
 
 


>>> "Silke Tölle" <toelle at hbz-nrw.de> 02.07.2012 18:07 >>>
Lieber Herr Grund,
 
das ist generell eine gute Nachricht, denn wir können sicher sagen,
dass wir mit den 280.000 geharvesteten Normdatensätzen nicht umgehen
können! Wobei wir noch nicht einmal angeschaut haben, was mit den
verknüpften Titeln passiert, was ja eigentlich unsere Testfrage war. 
 
Allein das Harvesten ist nicht problemlos, weil der dnb-Server nach
einer Weile immer wieder mit einem alten Datum geantwortet
(2011-05-13T12:52:12Z) hat, was im Ergebnis zum Abbruch des
automatischen harvestings im gewünschten Zeitfenster führt, so dass
immer wieder manuell neu aufgesetzt werden muss. 
Mit weiteren Testdetails werden wir uns morgen melden. 
 
Können Sie die Sätze, die Sekundärkorrekturen erfahren haben, die nur
dem nicht aktuellen Testsystem geschuldet sind, herausfiltern? Wie viele
Sätze werden letztendlich für dieses Päckchen tatsächlich geliefert? 
Oder anderes gefragt: Können Sie das Testsystem aktualisieren? Aus
unserer Sicht wäre es optimal, wenn wir für den Test diesen
unerwünschten Effekt nicht betrachten müssten. 
 
Wie gesagt, im Moment können wir definitiv kein grünes Licht für Match-
und Merge geben. Um schnellstmöglichst dahin zu kommen, ist ein Test
unter realen Bedingungen wirklich notwendig.
 
Viele Grüße
 
Silke Tölle 


 
---
Silke Tölle
hbz - Hochschulbibliothekszentrum NRW
Datenbankservices und Verbunddienstleistungen
Postfach 27 04 51
50510 Koeln
Tel. +49-221-40075-119  
Fax +49-221-40075-169
toelle at hbz-nrw.de 
www.hbz-nrw.de 
 
---
>>> "Grund, Stefan" <S.Grund at dnb.de> 02.07.2012 13:09 >>>
Liebe Fr. Tölle, lieber Herr Hupfer,

wir sprachen ja eben telephonisch über die hohe Anzahl von Änderungen
an Normdaten, die durch das Match&Merge-Verfahren von nur ca. 1.750
GND-Sätzen ausgelöst wurde. Dabei habe ich noch eine Sache vergessen:
Der Test fand ja im Testsystem statt, das ursprünglich bereits im
November letzten Jahres aufgesetzt wurde. Somit entspricht es nicht
100%ig dem Produktionssystem, dessen Migration im April 2012 lief. Dort
wurde nämlich bereits während der Migration ein Teil der Geographica
korrekt ausgetauscht. D.h. ein Großteil der Aktionen (der
"Sekundärkorrekturen", Änderungen der Relationierungen), die jetzt
erst durch Match&Merge im Testsystem passiert sind, sind im
Produktionssystem bereits erledigt. Im produktiven Lauf werden die
Zahlen daher niedriger sein. Für den Test jetzt war es aber vielleicht
nicht verkehrt, sich mal mit der Möglichkeit größerer Umfänge zu
beschäftigen.

Viele Grüße

Stefan Grund

--

***Lesen. Hören. Wissen. 100 Jahre Deutsche Nationalbibliothek***

Stefan Grund
Deutsche Nationalbibliothek
Informationstechnik
Adickesallee 1
D-60322 Frankfurt am Main
Tel: +49-69-1525-1719
Fax: +49-69-1525-1799
mailto:s.grund at dnb.de 
http://www.dnb.de 
http://www.dnb.de/100jahre 



-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : 6_11_gewinner_verlierer.gndidns
Dateityp    : application/octet-stream
Dateigröße  : 46920 bytes
Beschreibung: nicht verfügbar
URL         : http://lists.d-nb.de/mailman/private/gnd/attachments/20120703/df114d38/6_11_gewinner_verlierer-0001.obj