[gnd-ontology] schlagwortkategorie (rdf-type) fehlt.

Ralph Hafner Ralph.Hafner at uni-konstanz.de
Die Okt 14 11:20:16 CEST 2014


sehr geehrte damen und herren,

im neuen release des gnd-rdf-xml-datenabzugs vom 10.10.14, den wir am 
letzten wochenende heruntergeladen haben, fehlt leider bei einigen 
datens├Ątzen die information "rdf: type", vgl.:

    <rdf:Description rdf:about="http://d-nb.info/gnd/4141194-8">
<gndo:gndIdentifier>4141194-8</gndo:gndIdentifier>
<gndo:oldAuthorityNumber>(DE-588c)4141194-8</gndo:oldAuthorityNumber>
                 <gndo:gndSubjectCategory 
rdf:resource="http://d-nb.info/standards/vocab/gnd/gnd-sc#1" />
         </rdf:Description>

in der online verf├╝gbaren version des datensatzes ist diese info widerum 
vorhanden:
https://portal.dnb.de/opac.htm?method=simpleSearch&cqlMode=true&query=idn%3D041411943

     <rdf:Description rdf:about="http://d-nb.info/gnd/4141194-8">
<gndo:gndIdentifier>4141194-8</gndo:gndIdentifier>
<gndo:oldAuthorityNumber>(DE-588c)4141194-8</gndo:oldAuthorityNumber>
         <gndo:variantNameForTheSubjectHeading>Verteidigung 
&lt;Abwehr&gt;</gndo:variantNameForTheSubjectHeading>
<gndo:preferredNameForTheSubjectHeading>Abwehr</gndo:preferredNameForTheSubjectHeading>
         <gndo:gndSubjectCategory 
rdf:resource="http://d-nb.info/standards/vocab/gnd/gnd-sc#1" />
         <rdf:type 
rdf:resource="http://d-nb.info/standards/elementset/gnd#SubjectHeading" />
     </rdf:Description>
</rdf:RDF>

in einem ├Ąlteren gnd-datenabzug stimmte die anzahl der identifier mit 
der anzahl der rdf-type-infos ├╝berein: vgl.:
# grep '<gnd:gndIdentifier>' GND_190413.ttl.rdf |wc -l
9892485
# grep '<rdf:type' GND_190413.ttl.rdf |wc -l
9892494

im aktuellen gnd-datenabzug gibt es 10587749 identifier, aber nur 
9905970 rdf-type-informationen, das hei├čt bei 681779 datens├Ątzen fehlt 
die rdf-type-info, das entspricht rund 6 % der datens├Ątze.
# grep '<gndo:gndIdentifier>' GND_011014.rdf |wc -l
10587749
# grep '<rdf:type' GND_011014.rdf |wc -l
9905970

wir ben├Âtigen diese information "rdf:type" dringend f├╝r ein lokales 
programm bei uns. k├Ânnten sie bitte die daten ├╝berarbeiten und die 
rdf-type-info, dort, wo sie fehlt, erg├Ąnzen. das w├╝rde uns sehr 
weiterhelfen.

hintergrund: in konstanz haben wir ein programm entwickelt (das wir 
SiGMaMat genannt haben - SIS-GND-MatchingAutomat (SIS ist unser lokales 
Schlagwortinformationssystem), das die begriffe aus unserem lokalen 
schlagwortsystem zu ca. 70 % automatisch mit den normdaten der gnd und 
der viaf matcht. f├╝r die verbleibenden 30 % macht das programm 
matching-vorschl├Ąge. ziel ist es, k├╝nfitg in unserem lokalen system nur 
noch normdatenkonforme begriffe mit eindeutiger id zu verwenden, um 
darauf eine unterst├╝tzung f├╝r automatisiertes klassifizieren aufsetzen 
zu k├Ânnen.
die rdf-type-info wird in unserem sigmamat als information ben├Âtigt. sie 
steigert die prozentzahl im automatchingbereich in signifikanter weise. 
ohne die rdf-type-information k├Ânnen wir nur rund 50 % automatisch 
matchen, mit der rdf-type-information rund 66 %. das bedeutet bei rund 
180.000 aus unserem lokalen system insgesamt zu matchenden begriffen 
eine ersparnis an intellektuellem matchen von 28.800 begriffen.

vielen dank im voraus f├╝r ihre m├╝he!

mit den besten gr├╝├čen

ralph hafner

-- 
Ralph Hafner: Kontaktdaten Ralph Hafner
Universit├Ąt Konstanz
Kommunikations-, Informations-, Medienzentrum (KIM)
IT- und Bibliotheksdienste
Fachreferent f├╝r Romanistik, Slavistik, allg. Sprachwissenschaft und 
Medienwissenschaft
Sacherschlie├čungsbeauftragter
78457 Konstanz
Raum: B 1003a
Fon: +49 (0)7531 882836
Fax: +49 (0)7531 883082
ralph.hafner at uni-konstanz.de <mailto:ralph.hafner at uni-konstanz.de>

-------------- nńchster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: http://lists.dnb.de/pipermail/gnd-ontology/attachments/20141014/d9ee007c/attachment.html