[Lds] Mögliche Probleme mit dcterms:modified-Informationen in RDF-Beschreibungen

Adrian Pohl pohl at hbz-nrw.de
Mi Sep 5 14:34:48 CEST 2018


Liebe Kolleginnen und Kollegen,

mit Freude habe ich gelesen, dass im Oktober-Release auch Informationen 
zum Modifikationsdatum des zugrundeliegenden Datensatzes ergänzt werden. 
Zitat:

"Es werden jetzt auch Meta-Angaben über die Beschreibung der Entitäten
angegeben. Zunächst handelt es sind um die beiden Angaben 
"Änderungsdatum" und "Lizenz". Konkret: wann ist die Beschreibung der 
Entität zuletzt geändert worden und unter welchen Bedingungen darf die 
Beschreibung weiterverwendetwerden. Zu beachten ist, dass das 
Änderungsdatum (Property „dcterms:modified“) aus technischen Gründen 
vorerst der letzten Änderung des zugrundeliegenden Datensatzes im 
Bibliothekssystem der DNB entspricht. Unberücksichtigt bleiben
dabei im Fall von GND-Entitäten also zunächst Änderungen in den 
angereicherten Links (Properties foaf:page und viele der 
owl:sameAs-Aussagen).
Dies bedeutet, dass das Datum keinen Hinweis darauf gibt, ob seit dem 
Zeitpunkt zum Beispiel ein owl:sameAs-Link auf VIAF oder ein 
foaf:page-Link auf Wikipedia zugefügt oder entfernt wurde. Wir bitten, 
diese Ungenauigkeit bei der Nachnutzung zu berücksichtigen."

Zunächst zu Klarstellung eine Frage: Das bedeutet ja auch, dass unter 
"dct:modified" ein aktuelles Datum stehen kann, obwohl sich am RDF 
eigentlich in letzter Zeit gar nichts geändert hat, wenn die im 
Ursprungsdatensatz geänderten Informationen gar nicht nach RDF 
transformiert werden. Oder?

Nun zum Problem, das entstehen kann: Bei lobid sind wir ähnlich 
vorgegangen und hatten das Modifikationsdatum des Quelldatensatzes 
einfach an die RDF-Repräsentation gehängt. Mittlerweile sind wir damit 
nicht mehr zufrieden, seitdem wir detaillierte Provenienzinformationen 
im RDF haben, konnten aber die alte Praxis nicht mehr korrigieren, weil 
das die grundlegende API-Änderugnen wären.

Damit sich an der DNB die gleichen Erfahrungen nicht wiederholen müssen, 
weise ich in dieser E-Mail auf die Problematik hin.

Die Provenienzangaben eines lobid-resources-Datensatzes sehen im JSON-LD 
jetzt so aus:

{
   "id": "http://lobid.org/resources/HT008355456#!"
   "describedBy":{
     "dateCreated":"19980428",
     "id":"http://lobid.org/resources/HT008355456",
     "inDataset":{
       "id":"http://lobid.org/resources/dataset#!",
       "label":"lobid-resources – Der hbz-Verbundkatalog als Linked Open 
Data"
     },
     "label":"Webseite der hbz-Ressource HT008355456",
     "resultOf":{
       "endTime":"2018-05-03T11:44:22",
       "instrument":{
         "id":"https://github.com/hbz/lobid-resources",
         "label":"Software lobid-resources",
         "type":[
           "SoftwareApplication"
         ]
       },
       "object":{
         "id":"http://lobid.org/hbz01/HT008355456",
         "label":"hbz-Ressource HT008355456 im Exportformat",
         "type":[
           "DataFeedItem"
         ]
       },
       "type":[
         "CreateAction"
       ]
     },
     "sourceOrganization":{
       "id":"http://lobid.org/organisations/DE-6#!",
       "label":"lobid Organisation"
     },
     "type":[
       "BibliographicDescription"
     ]
   }
}

Dabei gilt:
- "http://lobid.org/resources/HT008355456" ist die URI des 
RDF-Datensatzes, der die bibliographische Ressource mit der URI 
"http://lobid.org/resources/HT008355456#!" beschreibt.
- Dieser Datensatz ist Ergebnis ("resultOf") einer "CreateAction" (das 
ist die Datentransformation), die das "instrument" 
lobid-resources-Software inklusive Metafacture-Konfiguration auf den 
MAB-XML-Quelldatensatz http://lobid.org/hbz01/HT008355456 anwendet.

Die dateCreated-Angabe stammt aus dem MAB-XML-Quelldatensatz, hängt aber 
– wie bereits gesagt – leider aus historischen Gründen an der 
RDF-Beschreibung. 100% korrekt wäre, wenn es beim Quelldatensatz stünde:

  "object":{
         "id":"http://lobid.org/hbz01/HT008355456",
         "label":"hbz-Ressource HT008355456 im Exportformat",
         "dateCreated":"19980428",
         "type":[
           "DataFeedItem"
         ]
       }

Details stehen im Ticket zur Ergänzung der 
lobid-resources-Provenienzinformationen:https://github.com/hbz/lobid-resources/issues/809

Viele Grüße
Adrian Pohl


-- 
Adrian Pohl
hbz - Hochschulbibliothekszentrum des Landes NRW
Jülicher Straße 6
50674 Köln
Telefon +49-221-40075-235
http://www.hbz-nrw.de


Mehr Informationen über die Mailingliste lds