[Lds] Mögliche Probleme mit dcterms:modified-Informationen in RDF-Beschreibungen

Hentschke, Jana J.Hentschke at dnb.de
Do Sep 6 12:15:25 CEST 2018


Lieber Adrian,

super, dass du hier auf die lobid-Modellierung hinweist und eure Erfahrungen dahin teilst. Herzlichen Dank dafür!

> Zunächst zu Klarstellung eine Frage: Das bedeutet ja auch, dass unter "dct:modified"
> ein aktuelles Datum stehen kann, obwohl sich am RDF eigentlich in letzter Zeit gar
> nichts geändert hat, wenn die im Ursprungsdatensatz geänderten Informationen gar
> nicht nach RDF transformiert werden. Oder?

Das ist richtig.

> Nun zum Problem, das entstehen kann: Bei lobid sind wir ähnlich vorgegangen und
> hatten das Modifikationsdatum des Quelldatensatzes einfach an die RDF-Repräsentation
> gehängt. [...]
> Damit sich an der DNB die gleichen Erfahrungen nicht wiederholen müssen, weise ich in
> dieser E-Mail auf die Problematik hin.

Bei den DNB-Daten liegt der Fall noch etwas anders. Hier ein Beispiel in N-Triples:

<http://d-nb.info/1000279642> <http://www.w3.org/2007/05/powder-s#describedby> <http://d-nb.info/1000279642/about> .
<http://d-nb.info/1000279642/about> <http://purl.org/dc/terms/license> <http://creativecommons.org/publicdomain/zero/1.0/> .
<http://d-nb.info/1000279642/about> <http://purl.org/dc/terms/modified> "2017-12-02T13:34:42.000"^^<http://www.w3.org/2001/XMLSchema#dateTime> .

* http://d-nb.info/1000279642/about ist der URI der (abstrakten) DNB-Beschreibung zum Buch. Soetwas wie die Menge aller in der DNB vorhandenen Informationen über das Buch. - Wenn wir dafür jetzt das Änderungsdatum des PICA-Datensatzes als dct:lastModified setzen, dann ist das nicht die ganze Wahrheit, weil wir (zumindest für GND) auch noch Anreicherungen aus VIAF und BEACONs haben. Da das aber aktuell nur GND und nicht alle Exportformaten betrifft, finde ich das im Moment vertretbar und von der Modellierung her noch keine Sackgasse.
* http://d-nb.info/1000279642/about/lds ist der zugehörige URI der RDF-Beschreibung - darüber machen wir derzeit gar keine Aussagen. Idealer Weise sind wir eines Tages in der Position, dass wir das Datum angeben können, wann sich genau die letzte Änderung am RDF ergeben hat, dann können wir sie hier anbringen.


Eure Modellierung mit schema:Action finde ich sehr interessant. Das behalte ich mal als Blaupause im Hinterkopf.

Neulich ist mir auch aufgefallen, dass ich im neuen RDA Toolkit mit dem Entitätentyp "Metadata Work" etwas tut:
https://beta.rdatoolkit.org/RDA.Web/Guidance/Index?externalId=en-US_provenance (leider nicht öffentlich zugänglich)
... bin da aber noch nicht richtig eingestiegen.

Besten Gruß von
Jana



*** Lesen. Hören. Wissen. Deutsche Nationalbibliothek *** 
 
-- 
Jana Hentschke
Deutsche Nationalbibliothek 
Informationsinfrastruktur
Adickesallee 1 
60322 Frankfurt am Main 
Telefon: +49 69 1525-1773
mailto:j.hentschke at dnb.de 
http://www.dnb.de  





> -----Ursprüngliche Nachricht-----
> Von: lds [mailto:lds-bounces at lists.dnb.de] Im Auftrag von Adrian Pohl
> Gesendet: Mittwoch, 5. September 2018 14:35
> An: lds at lists.dnb.de
> Betreff: [Lds] Mögliche Probleme mit dcterms:modified-Informationen in RDF-
> Beschreibungen
> 
> Liebe Kolleginnen und Kollegen,
> 
> mit Freude habe ich gelesen, dass im Oktober-Release auch Informationen zum
> Modifikationsdatum des zugrundeliegenden Datensatzes ergänzt werden.
> Zitat:
> 
> "Es werden jetzt auch Meta-Angaben über die Beschreibung der Entitäten angegeben.
> Zunächst handelt es sind um die beiden Angaben "Änderungsdatum" und "Lizenz".
> Konkret: wann ist die Beschreibung der Entität zuletzt geändert worden und unter
> welchen Bedingungen darf die Beschreibung weiterverwendetwerden. Zu beachten ist,
> dass das Änderungsdatum (Property „dcterms:modified“) aus technischen Gründen
> vorerst der letzten Änderung des zugrundeliegenden Datensatzes im Bibliothekssystem
> der DNB entspricht. Unberücksichtigt bleiben dabei im Fall von GND-Entitäten also
> zunächst Änderungen in den angereicherten Links (Properties foaf:page und viele der
> owl:sameAs-Aussagen).
> Dies bedeutet, dass das Datum keinen Hinweis darauf gibt, ob seit dem Zeitpunkt zum
> Beispiel ein owl:sameAs-Link auf VIAF oder ein foaf:page-Link auf Wikipedia zugefügt
> oder entfernt wurde. Wir bitten, diese Ungenauigkeit bei der Nachnutzung zu
> berücksichtigen."
> 
> Zunächst zu Klarstellung eine Frage: Das bedeutet ja auch, dass unter "dct:modified"
> ein aktuelles Datum stehen kann, obwohl sich am RDF eigentlich in letzter Zeit gar
> nichts geändert hat, wenn die im Ursprungsdatensatz geänderten Informationen gar
> nicht nach RDF transformiert werden. Oder?
> 
> Nun zum Problem, das entstehen kann: Bei lobid sind wir ähnlich vorgegangen und
> hatten das Modifikationsdatum des Quelldatensatzes einfach an die RDF-Repräsentation
> gehängt. Mittlerweile sind wir damit nicht mehr zufrieden, seitdem wir detaillierte
> Provenienzinformationen im RDF haben, konnten aber die alte Praxis nicht mehr
> korrigieren, weil das die grundlegende API-Änderugnen wären.
> 
> Damit sich an der DNB die gleichen Erfahrungen nicht wiederholen müssen, weise ich in
> dieser E-Mail auf die Problematik hin.
> 
> Die Provenienzangaben eines lobid-resources-Datensatzes sehen im JSON-LD jetzt so
> aus:
> 
> {
>    "id": "http://lobid.org/resources/HT008355456#!"
>    "describedBy":{
>      "dateCreated":"19980428",
>      "id":"http://lobid.org/resources/HT008355456",
>      "inDataset":{
>        "id":"http://lobid.org/resources/dataset#!",
>        "label":"lobid-resources – Der hbz-Verbundkatalog als Linked Open Data"
>      },
>      "label":"Webseite der hbz-Ressource HT008355456",
>      "resultOf":{
>        "endTime":"2018-05-03T11:44:22",
>        "instrument":{
>          "id":"https://github.com/hbz/lobid-resources",
>          "label":"Software lobid-resources",
>          "type":[
>            "SoftwareApplication"
>          ]
>        },
>        "object":{
>          "id":"http://lobid.org/hbz01/HT008355456",
>          "label":"hbz-Ressource HT008355456 im Exportformat",
>          "type":[
>            "DataFeedItem"
>          ]
>        },
>        "type":[
>          "CreateAction"
>        ]
>      },
>      "sourceOrganization":{
>        "id":"http://lobid.org/organisations/DE-6#!",
>        "label":"lobid Organisation"
>      },
>      "type":[
>        "BibliographicDescription"
>      ]
>    }
> }
> 
> Dabei gilt:
> - "http://lobid.org/resources/HT008355456" ist die URI des RDF-Datensatzes, der die
> bibliographische Ressource mit der URI "http://lobid.org/resources/HT008355456#!"
> beschreibt.
> - Dieser Datensatz ist Ergebnis ("resultOf") einer "CreateAction" (das ist die
> Datentransformation), die das "instrument"
> lobid-resources-Software inklusive Metafacture-Konfiguration auf den MAB-XML-
> Quelldatensatz http://lobid.org/hbz01/HT008355456 anwendet.
> 
> Die dateCreated-Angabe stammt aus dem MAB-XML-Quelldatensatz, hängt aber – wie
> bereits gesagt – leider aus historischen Gründen an der RDF-Beschreibung. 100%
> korrekt wäre, wenn es beim Quelldatensatz stünde:
> 
>   "object":{
>          "id":"http://lobid.org/hbz01/HT008355456",
>          "label":"hbz-Ressource HT008355456 im Exportformat",
>          "dateCreated":"19980428",
>          "type":[
>            "DataFeedItem"
>          ]
>        }
> 
> Details stehen im Ticket zur Ergänzung der
> lobid-resources-Provenienzinformationen:https://github.com/hbz/lobid-
> resources/issues/809
> 
> Viele Grüße
> Adrian Pohl
> 
> 
> --
> Adrian Pohl
> hbz - Hochschulbibliothekszentrum des Landes NRW Jülicher Straße 6
> 50674 Köln
> Telefon +49-221-40075-235
> http://www.hbz-nrw.de
> _______________________________________________
> lds mailing list
> lds at lists.dnb.de
> https://lists.dnb.de/mailman/listinfo/lds


Mehr Informationen über die Mailingliste lds