[Lds] WG: Neues GND LOD release

Hentschke, Jana J.Hentschke at dnb.de
Di Jul 3 10:39:44 CEST 2018


Diese zusätzlichen Informationen zur Bereitstellung des GND-Dumps auch an diese Liste zur Kenntnis.

Besten Gruß von
Jana Hentschke

Von: Gnd-ontology [mailto:gnd-ontology-bounces at lists.dnb.de] Im Auftrag von Datendienste
Gesendet: Dienstag, 3. Juli 2018 09:09
An: 'Neubert, Joachim' <J.Neubert at zbw.eu>; gnd-ontology at lists.dnb.de
Betreff: Re: [gnd-ontology] Neues GND LOD release

Sehr geehrter Herr Neubert,

im Rahmen des Linked-Data-Service wurde das erste Mal die GND in mehreren Dateien gesplittet nach Entitaetentypen angeboten:

- gndo:DifferentiatedPerson + gndo:Family (Dateibenennungen beginnend mit Tpgesamt ...)
- gndo:SubjectHeading (Dateibenennungen beginnend mit Tsgesamt ...)
- gndo:CorporateBody (Dateibenennungen beginnend mit Tbgesamt ...)
- gndo:PlaceOrGeographicName (Dateibenennungen beginnend mit Tggesamt ...)
- gndo:Work (Dateibenennungen beginnend mit Tugesamt ...)
- gndo:ConferenceOrEvent (Dateibenennungen beginnend mit Tfgesamt ...)
- gndo:UndifferentiatedPerson (Dateibenennungen beginnend mit Tngesamt ...)

Diese Form der Bereitstellung haben wir aufgrund von mehrfachen Kundenwuenschen gewaehlt. Eine zusaetzliche Bereitstellung in einer Gesamtdatei ist zurzeit nicht angedacht. Die aktuellen RDF-Dumps in der HDT-Version stehen weiterhin als Gesamtdatei zur Verfuegung.

Die von Ihnen erwaehnte Datei „Umlenk_Loesch_GND …“ wurde nur fuer den MARC-Gesamtabzug bereitgestellt (darauf bezog sich die verlinkte Ankuendigung http://www.dnb.de/SharedDocs/Downloads/DE/DNB/service/rundschreiben20180627GrundbestandGND.pdf). Die Bereitstellung im Rahmen des Linked-Data-Service ist in Planung. Voraussetzung dafür ist jedoch, dass zunächst eine Konversion der Loeschsaetze implementiert wird.

Zur konkreten Nachfrage der Benennung der Datei: T<TYP>gesamt<RELEASE>gnd.<EXT>.gz:
Die Namenskonvention wird so bleiben. Gerne nehme ich jedoch Ihre Anregung auf und werde fuer „Release“ folgende Darstellung waehlen: vierstelliges Jahr_Unterstrich Zaehlung des Releases. (Aktuell haben wir den Bereitstellungsmonat gewaehlt. Zukuenftig werden wir dann von 01 bis 03 zaehlen zur Angabe des Releaeses.)
Beispiel: Tbgesamt2018_03.ttl.gz



Freundliche Grüße
i. A. Heike Eichenauer

*** Lesen. Hören. Wissen. Deutsche Nationalbibliothek ***

--
Heike Eichenauer
Deutsche Nationalbibliothek
Digitale Dienste
Adickesallee 1
60322 Frankfurt
Telefon: +49 69 1525-1074
Telefax: +49 69 1525-1636
mailto:h.eichenauer at dnb.de
http://www.dnb.de<http://www.dnb.de/>
Newsletter<http://www.dnb.de/newsletter> Facebook<https://www.facebook.com/DeutscheNationalbibliothek> Twitter<https://twitter.com/DNB_Aktuelles>

Von: Gnd-ontology [mailto:gnd-ontology-bounces at lists.dnb.de] Im Auftrag von Neubert, Joachim
Gesendet: Montag, 2. Juli 2018 11:53
An: 'gnd-ontology at lists.dnb.de' <gnd-ontology at lists.dnb.de<mailto:gnd-ontology at lists.dnb.de>>
Betreff: [gnd-ontology] Neues GND LOD release

Liebe DNB-KollegInnen,

bisher war der GND-Download in einer Datei GND.ttl.gz enthalten. Für den aktuellen Download wurde mitgeteilt (http://www.dnb.de/SharedDocs/Downloads/DE/DNB/service/rundschreiben20180627GrundbestandGND.pdf?__blob=publicationFile), dass pro GND-Entität eine Datei erstellt worden sei.

Tbgesamt1806gnd.ttl.gz
Tfgesamt1806gnd.ttl.gz
Tggesamt1806gnd.ttl.gz
Tpgesamt1806gnd.ttl.gz
Tsgesamt1806gnd.ttl.gz
Tugesamt1806gnd.ttl.gz

Außerdem Tngesamt1806gnd.ttl.gz mit nicht individualisierten Personennamen. Ankündigt ist eine Datei „Umlenk_Loesch_GND …“ mit Redirects, die jedoch offenbar (noch) nicht bereitgestellt wurde.

Bevor ich jetzt mein Download-Script anpasse, zwei Fragen:

-          Ist es möglich, weiter einen Gesamt-GND-Dump mit allen Informationen bereitzustellen? Für diejenigen, die doch den gesamten Bestand brauchen – und sei es nur, um Geographika, Affiliations etc. aufzulösen -, würde das die Verarbeitung deutlich vereinfachen.

-          Sollen künftige Releases ebenfalls der oben herauszulesenden Namenskonvention
T<TYP>gesamt<RELEASE>gnd.<EXT>.gz
folgen? Und insbesondere: Ist damit ein eindeutiger Name für das Release kreiert? (in meinen Augen wäre das ein deutlicher Fortschritt – wenn ich auch eher ein vierstelliges Jahr wählen würde :))

Schöne Grüße, Joachim Neubert




-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://lists.dnb.de/pipermail/lds/attachments/20180703/2ea4d6dd/attachment.html>
-------------- nächster Teil --------------
Ein eingebundener Text mit undefiniertem Zeichensatz wurde abgetrennt.
Name: ATT00001.txt
URL: <http://lists.dnb.de/pipermail/lds/attachments/20180703/2ea4d6dd/attachment.txt>


Mehr Informationen über die Mailingliste lds