[gnd-ontology] schlagwortkategorie (rdf-type) fehlt.

Ralph Hafner Ralph.Hafner at uni-konstanz.de
Die Okt 14 11:20:16 CEST 2014


sehr geehrte damen und herren,

im neuen release des gnd-rdf-xml-datenabzugs vom 10.10.14, den wir am 
letzten wochenende heruntergeladen haben, fehlt leider bei einigen 
datensätzen die information "rdf: type", vgl.:

    <rdf:Description rdf:about="http://d-nb.info/gnd/4141194-8">
<gndo:gndIdentifier>4141194-8</gndo:gndIdentifier>
<gndo:oldAuthorityNumber>(DE-588c)4141194-8</gndo:oldAuthorityNumber>
                 <gndo:gndSubjectCategory 
rdf:resource="http://d-nb.info/standards/vocab/gnd/gnd-sc#1" />
         </rdf:Description>

in der online verfügbaren version des datensatzes ist diese info widerum 
vorhanden:
https://portal.dnb.de/opac.htm?method=simpleSearch&cqlMode=true&query=idn%3D041411943

     <rdf:Description rdf:about="http://d-nb.info/gnd/4141194-8">
<gndo:gndIdentifier>4141194-8</gndo:gndIdentifier>
<gndo:oldAuthorityNumber>(DE-588c)4141194-8</gndo:oldAuthorityNumber>
         <gndo:variantNameForTheSubjectHeading>Verteidigung 
&lt;Abwehr&gt;</gndo:variantNameForTheSubjectHeading>
<gndo:preferredNameForTheSubjectHeading>Abwehr</gndo:preferredNameForTheSubjectHeading>
         <gndo:gndSubjectCategory 
rdf:resource="http://d-nb.info/standards/vocab/gnd/gnd-sc#1" />
         <rdf:type 
rdf:resource="http://d-nb.info/standards/elementset/gnd#SubjectHeading" />
     </rdf:Description>
</rdf:RDF>

in einem älteren gnd-datenabzug stimmte die anzahl der identifier mit 
der anzahl der rdf-type-infos überein: vgl.:
# grep '<gnd:gndIdentifier>' GND_190413.ttl.rdf |wc -l
9892485
# grep '<rdf:type' GND_190413.ttl.rdf |wc -l
9892494

im aktuellen gnd-datenabzug gibt es 10587749 identifier, aber nur 
9905970 rdf-type-informationen, das heißt bei 681779 datensätzen fehlt 
die rdf-type-info, das entspricht rund 6 % der datensätze.
# grep '<gndo:gndIdentifier>' GND_011014.rdf |wc -l
10587749
# grep '<rdf:type' GND_011014.rdf |wc -l
9905970

wir benötigen diese information "rdf:type" dringend für ein lokales 
programm bei uns. könnten sie bitte die daten überarbeiten und die 
rdf-type-info, dort, wo sie fehlt, ergänzen. das würde uns sehr 
weiterhelfen.

hintergrund: in konstanz haben wir ein programm entwickelt (das wir 
SiGMaMat genannt haben - SIS-GND-MatchingAutomat (SIS ist unser lokales 
Schlagwortinformationssystem), das die begriffe aus unserem lokalen 
schlagwortsystem zu ca. 70 % automatisch mit den normdaten der gnd und 
der viaf matcht. für die verbleibenden 30 % macht das programm 
matching-vorschläge. ziel ist es, künfitg in unserem lokalen system nur 
noch normdatenkonforme begriffe mit eindeutiger id zu verwenden, um 
darauf eine unterstützung für automatisiertes klassifizieren aufsetzen 
zu können.
die rdf-type-info wird in unserem sigmamat als information benötigt. sie 
steigert die prozentzahl im automatchingbereich in signifikanter weise. 
ohne die rdf-type-information können wir nur rund 50 % automatisch 
matchen, mit der rdf-type-information rund 66 %. das bedeutet bei rund 
180.000 aus unserem lokalen system insgesamt zu matchenden begriffen 
eine ersparnis an intellektuellem matchen von 28.800 begriffen.

vielen dank im voraus für ihre mühe!

mit den besten grüßen

ralph hafner

-- 
Ralph Hafner: Kontaktdaten Ralph Hafner
Universität Konstanz
Kommunikations-, Informations-, Medienzentrum (KIM)
IT- und Bibliotheksdienste
Fachreferent für Romanistik, Slavistik, allg. Sprachwissenschaft und 
Medienwissenschaft
Sacherschließungsbeauftragter
78457 Konstanz
Raum: B 1003a
Fon: +49 (0)7531 882836
Fax: +49 (0)7531 883082
ralph.hafner at uni-konstanz.de <mailto:ralph.hafner at uni-konstanz.de>

-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: http://lists.dnb.de/pipermail/gnd-ontology/attachments/20141014/d9ee007c/attachment.html