[gnd-ontology] schlagwortkategorie (rdf-type) fehlt.
Ralph Hafner
Ralph.Hafner at uni-konstanz.de
Die Okt 14 11:20:16 CEST 2014
sehr geehrte damen und herren,
im neuen release des gnd-rdf-xml-datenabzugs vom 10.10.14, den wir am
letzten wochenende heruntergeladen haben, fehlt leider bei einigen
datensätzen die information "rdf: type", vgl.:
<rdf:Description rdf:about="http://d-nb.info/gnd/4141194-8">
<gndo:gndIdentifier>4141194-8</gndo:gndIdentifier>
<gndo:oldAuthorityNumber>(DE-588c)4141194-8</gndo:oldAuthorityNumber>
<gndo:gndSubjectCategory
rdf:resource="http://d-nb.info/standards/vocab/gnd/gnd-sc#1" />
</rdf:Description>
in der online verfügbaren version des datensatzes ist diese info widerum
vorhanden:
https://portal.dnb.de/opac.htm?method=simpleSearch&cqlMode=true&query=idn%3D041411943
<rdf:Description rdf:about="http://d-nb.info/gnd/4141194-8">
<gndo:gndIdentifier>4141194-8</gndo:gndIdentifier>
<gndo:oldAuthorityNumber>(DE-588c)4141194-8</gndo:oldAuthorityNumber>
<gndo:variantNameForTheSubjectHeading>Verteidigung
<Abwehr></gndo:variantNameForTheSubjectHeading>
<gndo:preferredNameForTheSubjectHeading>Abwehr</gndo:preferredNameForTheSubjectHeading>
<gndo:gndSubjectCategory
rdf:resource="http://d-nb.info/standards/vocab/gnd/gnd-sc#1" />
<rdf:type
rdf:resource="http://d-nb.info/standards/elementset/gnd#SubjectHeading" />
</rdf:Description>
</rdf:RDF>
in einem älteren gnd-datenabzug stimmte die anzahl der identifier mit
der anzahl der rdf-type-infos überein: vgl.:
# grep '<gnd:gndIdentifier>' GND_190413.ttl.rdf |wc -l
9892485
# grep '<rdf:type' GND_190413.ttl.rdf |wc -l
9892494
im aktuellen gnd-datenabzug gibt es 10587749 identifier, aber nur
9905970 rdf-type-informationen, das heißt bei 681779 datensätzen fehlt
die rdf-type-info, das entspricht rund 6 % der datensätze.
# grep '<gndo:gndIdentifier>' GND_011014.rdf |wc -l
10587749
# grep '<rdf:type' GND_011014.rdf |wc -l
9905970
wir benötigen diese information "rdf:type" dringend für ein lokales
programm bei uns. könnten sie bitte die daten überarbeiten und die
rdf-type-info, dort, wo sie fehlt, ergänzen. das würde uns sehr
weiterhelfen.
hintergrund: in konstanz haben wir ein programm entwickelt (das wir
SiGMaMat genannt haben - SIS-GND-MatchingAutomat (SIS ist unser lokales
Schlagwortinformationssystem), das die begriffe aus unserem lokalen
schlagwortsystem zu ca. 70 % automatisch mit den normdaten der gnd und
der viaf matcht. für die verbleibenden 30 % macht das programm
matching-vorschläge. ziel ist es, künfitg in unserem lokalen system nur
noch normdatenkonforme begriffe mit eindeutiger id zu verwenden, um
darauf eine unterstützung für automatisiertes klassifizieren aufsetzen
zu können.
die rdf-type-info wird in unserem sigmamat als information benötigt. sie
steigert die prozentzahl im automatchingbereich in signifikanter weise.
ohne die rdf-type-information können wir nur rund 50 % automatisch
matchen, mit der rdf-type-information rund 66 %. das bedeutet bei rund
180.000 aus unserem lokalen system insgesamt zu matchenden begriffen
eine ersparnis an intellektuellem matchen von 28.800 begriffen.
vielen dank im voraus für ihre mühe!
mit den besten grüßen
ralph hafner
--
Ralph Hafner: Kontaktdaten Ralph Hafner
Universität Konstanz
Kommunikations-, Informations-, Medienzentrum (KIM)
IT- und Bibliotheksdienste
Fachreferent für Romanistik, Slavistik, allg. Sprachwissenschaft und
Medienwissenschaft
Sacherschließungsbeauftragter
78457 Konstanz
Raum: B 1003a
Fon: +49 (0)7531 882836
Fax: +49 (0)7531 883082
ralph.hafner at uni-konstanz.de <mailto:ralph.hafner at uni-konstanz.de>
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: http://lists.dnb.de/pipermail/gnd-ontology/attachments/20141014/d9ee007c/attachment.html