<html>
<head>
<meta http-equiv="content-type" content="text/html; charset=UTF-8">
</head>
<body text="#000000" bgcolor="#FFFFFF">
sehr geehrte damen und herren, <br>
<br>
im neuen release des gnd-rdf-xml-datenabzugs vom 10.10.14, den wir
am letzten wochenende heruntergeladen haben, fehlt leider bei
einigen datensätzen die information "rdf: type", vgl.:<br>
<br>
<rdf:Description
rdf:about=<a class="moz-txt-link-rfc2396E" href="http://d-nb.info/gnd/4141194-8">"http://d-nb.info/gnd/4141194-8"</a>><br>
<gndo:gndIdentifier>4141194-8</gndo:gndIdentifier><br>
<gndo:oldAuthorityNumber>(DE-588c)4141194-8</gndo:oldAuthorityNumber><br>
<gndo:gndSubjectCategory
rdf:resource=<a class="moz-txt-link-rfc2396E" href="http://d-nb.info/standards/vocab/gnd/gnd-sc#1">"http://d-nb.info/standards/vocab/gnd/gnd-sc#1"</a> /><br>
</rdf:Description><br>
<br>
in der online verfügbaren version des datensatzes ist diese info
widerum vorhanden:<br>
<a class="moz-txt-link-freetext" href="https://portal.dnb.de/opac.htm?method=simpleSearch&cqlMode=true&query=idn%3D041411943">https://portal.dnb.de/opac.htm?method=simpleSearch&cqlMode=true&query=idn%3D041411943</a><br>
<br>
<rdf:Description
rdf:about=<a class="moz-txt-link-rfc2396E" href="http://d-nb.info/gnd/4141194-8">"http://d-nb.info/gnd/4141194-8"</a>><br>
<gndo:gndIdentifier>4141194-8</gndo:gndIdentifier><br>
<gndo:oldAuthorityNumber>(DE-588c)4141194-8</gndo:oldAuthorityNumber><br>
<gndo:variantNameForTheSubjectHeading>Verteidigung
&lt;Abwehr&gt;</gndo:variantNameForTheSubjectHeading><br>
<gndo:preferredNameForTheSubjectHeading>Abwehr</gndo:preferredNameForTheSubjectHeading><br>
<gndo:gndSubjectCategory
rdf:resource=<a class="moz-txt-link-rfc2396E" href="http://d-nb.info/standards/vocab/gnd/gnd-sc#1">"http://d-nb.info/standards/vocab/gnd/gnd-sc#1"</a> /><br>
<rdf:type
rdf:resource=<a class="moz-txt-link-rfc2396E" href="http://d-nb.info/standards/elementset/gnd#SubjectHeading">"http://d-nb.info/standards/elementset/gnd#SubjectHeading"</a>
/><br>
</rdf:Description><br>
</rdf:RDF><br>
<br>
in einem älteren gnd-datenabzug stimmte die anzahl der identifier
mit der anzahl der rdf-type-infos überein: vgl.: <br>
# grep '<gnd:gndIdentifier>' GND_190413.ttl.rdf |wc -l<br>
9892485<br>
# grep '<rdf:type' GND_190413.ttl.rdf |wc -l<br>
9892494<br>
<br>
im aktuellen gnd-datenabzug gibt es 10587749 identifier, aber nur
9905970 rdf-type-informationen, das heißt bei 681779 datensätzen
fehlt die rdf-type-info, das entspricht rund 6 % der datensätze.<br>
# grep '<gndo:gndIdentifier>' GND_011014.rdf |wc -l<br>
10587749<br>
# grep '<rdf:type' GND_011014.rdf |wc -l<br>
9905970<br>
<br>
wir benötigen diese information "rdf:type" dringend für ein lokales
programm bei uns. könnten sie bitte die daten überarbeiten und die
rdf-type-info, dort, wo sie fehlt, ergänzen. das würde uns sehr
weiterhelfen.<br>
<br>
hintergrund: in konstanz haben wir ein programm entwickelt (das wir
SiGMaMat genannt haben - SIS-GND-MatchingAutomat (SIS ist unser
lokales Schlagwortinformationssystem), das die begriffe aus unserem
lokalen schlagwortsystem zu ca. 70 % automatisch mit den normdaten
der gnd und der viaf matcht. für die verbleibenden 30 % macht das
programm matching-vorschläge. ziel ist es, künfitg in unserem
lokalen system nur noch normdatenkonforme begriffe mit eindeutiger
id zu verwenden, um darauf eine unterstützung für automatisiertes
klassifizieren aufsetzen zu können. <br>
die rdf-type-info wird in unserem sigmamat als information benötigt.
sie steigert die prozentzahl im automatchingbereich in signifikanter
weise. ohne die rdf-type-information können wir nur rund 50 %
automatisch matchen, mit der rdf-type-information rund 66 %. das
bedeutet bei rund 180.000 aus unserem lokalen system insgesamt zu
matchenden begriffen eine ersparnis an intellektuellem matchen von
28.800 begriffen.<br>
<br>
vielen dank im voraus für ihre mühe!<br>
<br>
mit den besten grüßen<br>
<br>
ralph hafner<br>
<br>
<div class="moz-signature">-- <br>
<meta content="text/html; charset=UTF-8" http-equiv="content-type">
<title>Ralph Hafner: Kontaktdaten</title>
Ralph Hafner <br>
Universität Konstanz
<br>
Kommunikations-, Informations-, Medienzentrum (KIM)
<br>
IT- und Bibliotheksdienste
<br>
Fachreferent für Romanistik, Slavistik, allg. Sprachwissenschaft
und Medienwissenschaft<br>
Sacherschließungsbeauftragter<br>
78457 Konstanz
<br>
Raum: B 1003a<br>
Fon: +49 (0)7531 882836<br>
Fax: +49 (0)7531 883082<br>
<a href="mailto:ralph.hafner@uni-konstanz.de">ralph.hafner@uni-konstanz.de</a><br>
<br>
</div>
</body>
</html>