[gnd-ontology] schlagwortkategorie (rdf-type) fehlt.

Datendienste Datendienste at dnb.de
Die Okt 14 13:27:50 CEST 2014


Sehr geehrter Herr Hafner,
vielen Dank fuer den Hinweis und das Interesse an der GND. 
Der Fehler ist bekannt (s. z. B. http://lists.dnb.de/pipermail/gnd-ontology/2014-August/000034.html ) wir arbeiten an der Behebung. Dieser wird voraussichtlich zum Release 02.2015 (19.05.2015) behoben, s. https://wiki.dnb.de/x/wgcbBQ 

Freundliche Grüße
i. A. Jochen Rupp

*** Lesen. Hören. Wissen. Deutsche Nationalbibliothek ***
--
Jochen Rupp
Deutsche Nationalbibliothek
Digitale Dienste
Adickesallee 1
D-60322 Frankfurt am Main
Telefon: +49-69-1525-1018
Telefax: +49-69-1525-1636

Von: gnd-ontology-bounces at lists.dnb.de [mailto:gnd-ontology-bounces at lists.dnb.de] Im Auftrag von Ralph Hafner
Gesendet: Dienstag, 14. Oktober 2014 11:20
An: gnd-ontology at lists.dnb.de
Betreff: [gnd-ontology] schlagwortkategorie (rdf-type) fehlt.

sehr geehrte damen und herren, 

im neuen release des gnd-rdf-xml-datenabzugs vom 10.10.14, den wir am letzten wochenende heruntergeladen haben, fehlt leider bei einigen datensätzen die information "rdf: type", vgl.:

   <rdf:Description rdf:about="http://d-nb.info/gnd/4141194-8">
                <gndo:gndIdentifier>4141194-8</gndo:gndIdentifier>
                <gndo:oldAuthorityNumber>(DE-588c)4141194-8</gndo:oldAuthorityNumber>
                <gndo:gndSubjectCategory rdf:resource="http://d-nb.info/standards/vocab/gnd/gnd-sc#1" />
        </rdf:Description>

in der online verfügbaren version des datensatzes ist diese info widerum vorhanden:
https://portal.dnb.de/opac.htm?method=simpleSearch&cqlMode=true&query=idn%3D041411943

    <rdf:Description rdf:about="http://d-nb.info/gnd/4141194-8">
        <gndo:gndIdentifier>4141194-8</gndo:gndIdentifier>
        <gndo:oldAuthorityNumber>(DE-588c)4141194-8</gndo:oldAuthorityNumber>
        <gndo:variantNameForTheSubjectHeading>Verteidigung &lt;Abwehr&gt;</gndo:variantNameForTheSubjectHeading>
        <gndo:preferredNameForTheSubjectHeading>Abwehr</gndo:preferredNameForTheSubjectHeading>
        <gndo:gndSubjectCategory rdf:resource="http://d-nb.info/standards/vocab/gnd/gnd-sc#1" />
        <rdf:type rdf:resource="http://d-nb.info/standards/elementset/gnd#SubjectHeading" />
    </rdf:Description>
</rdf:RDF>

in einem älteren gnd-datenabzug stimmte die anzahl der identifier mit der anzahl der rdf-type-infos überein: vgl.: 
# grep '<gnd:gndIdentifier>' GND_190413.ttl.rdf |wc -l
9892485
# grep '<rdf:type' GND_190413.ttl.rdf |wc -l
9892494

im aktuellen gnd-datenabzug gibt es 10587749 identifier, aber nur 9905970 rdf-type-informationen, das heißt bei 681779 datensätzen fehlt die rdf-type-info, das entspricht rund 6 % der datensätze.
# grep '<gndo:gndIdentifier>' GND_011014.rdf |wc -l
10587749
# grep '<rdf:type' GND_011014.rdf |wc -l
9905970

wir benötigen diese information "rdf:type" dringend für ein lokales programm bei uns. könnten sie bitte die daten überarbeiten und die rdf-type-info, dort, wo sie fehlt, ergänzen. das würde uns sehr weiterhelfen.

hintergrund: in konstanz haben wir ein programm entwickelt (das wir SiGMaMat genannt haben - SIS-GND-MatchingAutomat (SIS ist unser lokales Schlagwortinformationssystem), das die begriffe aus unserem lokalen schlagwortsystem zu ca. 70 % automatisch mit den normdaten der gnd und der viaf matcht. für die verbleibenden 30 % macht das programm matching-vorschläge. ziel ist es, künfitg in unserem lokalen system nur noch normdatenkonforme begriffe mit eindeutiger id zu verwenden, um darauf eine unterstützung für automatisiertes klassifizieren aufsetzen zu können. 
die rdf-type-info wird in unserem sigmamat als information benötigt. sie steigert die prozentzahl im automatchingbereich in signifikanter weise. ohne die rdf-type-information können wir nur rund 50 %  automatisch matchen, mit der rdf-type-information rund 66 %. das bedeutet bei rund 180.000 aus unserem lokalen system insgesamt zu matchenden begriffen eine ersparnis an intellektuellem matchen von 28.800 begriffen.

vielen dank im voraus für ihre mühe!

mit den besten grüßen

ralph hafner
-- 
Ralph Hafner 
Universität Konstanz 
Kommunikations-, Informations-, Medienzentrum (KIM) 
IT- und Bibliotheksdienste 
Fachreferent für Romanistik, Slavistik, allg. Sprachwissenschaft und Medienwissenschaft
Sacherschließungsbeauftragter
78457 Konstanz 
Raum: B 1003a
Fon: +49 (0)7531 882836
Fax: +49 (0)7531 883082
ralph.hafner at uni-konstanz.de