[rak-list] Neu: Hathi

Bernhard Eversberg ev at biblio.tu-bs.de
Tue Sep 30 13:29:22 CEST 2008


Langsam muß man doch mal fragen, wo denn die Millionen digitalisierten
Bücher der Google-Teilnehmerbibliotheken zu finden sind. Klar, alle sind
im Google-Booksearch zu finden und damit mag man zufrieden sein.

Eine US-Initiative ist damit nicht zufrieden, sondern will das Material
auf eigene Weise in einem gemeinsamen Pool zusätzlich vorhalten und
auf eigene Weise zugänglich machen. Dieser Tage wurde bekannt, daß dazu
ein Konsortium unter dem Namen "Hathi Trust" gegründet wurde (das sei
Hindi für "Elefant").

   http://www.hathitrust.org/

Hathi soll eine Plattform bieten nicht nur für GB-Digitalisate, sondern
auch für Material aus anderen Projekten.
Es gibt zur Zeit 13 Mitglieder:
     * Indiana University
     * The University of Chicago
     * University of Illinois
     * University of Illinois at Chicago
     * The University of Iowa
     * University of Michigan
     * Michigan State University
     * University of Minnesota
     * Northwestern University
     * The Ohio State University
     * Penn State University
     * Purdue University
     * University of Wisconsin-Madison
und neue sind willkommen (in München zaudert man wohl noch).
Hathi macht bibliographische Daten der Dokumente verfügbar, zunächst
aber leider nur in einem recht simplen Format, z.B. nur mit Verf.Angabe
und ohne Namensansetzung wenigstens des ersten Verf. Gleichwohl kann man
daraus Datensätze machen, die man in einen eigenen Katalog einspeisen
könnte, um die Titel auffindbar zu machen. Nur ca. 18% davon sind frei
verfügbar (vornehmlich Erscheinungen vor 1923), also public domain.
In den Daten sind sie gekennzeichnet.
MARC-Daten rauszurücken traut man sich wohl wieder mal nicht, vermutlich
aus demselben Grund wie immer: OCLC hat den Daumen drauf.
Es wäre wohl weniger für Einzelbibliotheken sinnvoll, sich die Daten
in den OPAC reinzuziehen, als für Verbünde, wenn sie denn ausreichend
tauglich wären.
Daten der neu eingehenden Digitalisate macht Hathi täglich verfügbar, es
handelt sich meist um mehr als 500 am Tag. Monatlich wird kumuliert.

Ein eigenes Suchsystem ist erst im Aufbau, darüber weiß man noch nicht viel.

Insgesamt aber wieder mal ein Beispiel, wie die Bibliothekswelt durch
ihre extreme Heterogenität in der freien Bereitstellung von Daten in der
heutigen interaktiven und interoperablen Netzwelt einfach nicht recht
Fuß fassen kann und damit zusehends weiter an Boden verliert. Es ist
doch ganz klar, daß man dem Google Booksearch ein in wichtigen Punkten
besseres Angebot entgegensetzen könnte. GB kann nicht "zusammenführen,
was zusammengehört", ganz kurz gesagt, jedenfalls nicht mit einer
irgendwie definierbaren Zuverlässigkeit - genauso wie der normale 
Google. Das geht halt nur mit kontrollierten, normierten Daten.


B.Eversberg




More information about the rak-list mailing list