[dini-ag-kim-lld] Mappings jetzt im BEACON-Format
Kai Eckert
eckert at bib.uni-mannheim.de
Wed Dec 7 13:09:40 CET 2011
TARGETREFIX ist ungeschickt formuliert, was ist der Unterschied zu
TARGET? Du meinst ja, dass bei Angabe des TARGETPREFIX in einer zweiten
Spalte nach Target-IDs gesucht wird.
Der Ansatz gefällt mir, das ist eine Erweiterung, die sicher auch viele
haben wollen. Muss man nur aufpassen, dass die Reihenfolge und Bedeutung
der Felder wirklich klar bleibt. Was mich zu meinem Ansatz zurückbringt,
ob man nicht doch ein allgemeines Header-Format definieren kann, das auf
ein beliebiges CSV passt. Ich brainstorme mal:
#FORMAT: BEACON
#PREFIX|1: http://d-nb.info/gnd/
#PREFIX|2: http://musicbrainz.org/artist/
#LINK|1|2: http://www.w3.org/2002/07/owl#sameAs
#DESCRIPTION|1|2: {4} Treffer auf MusicBrainz
#LINK|2|3: rdfs:label
100140084|7c432bb8-2721-407d-a99f-d77d7a245958|Super Typ|23
...
Beim DESCRIPTION Feld bin ich mir gerade nicht sicher, ob das das Feld
war, wo auch die Anzahl der Treffer in deinen Beispielen ausgegeben
wurde. Auf jeden Fall könnte man so den Text klar einem Link zuweisen
durch die Indizierung im Feldnamen, die Platzhalter im text selbst wie
{5} beziehen sich auf beliebige andere Spalten des CSV.
Indexnummer habe ich mal Informatikeruntypisch ab 1 gestartet, kann man
drüber diskutieren, wenn man mag.
So wäre das auf jeden Fall generisch. Die nächste Frage ist, ob man es
für die Standardfälle einfacher machen kann. Zur Abwaärtskompatibilität
könnte man festlegen:
- #PREFIX ist ein Shortcut für #PREFIX|1
- #TARGET ist ein Shortcut für #PREFIX|2
- #LINK ist ein Shortcut für #LINK|1|2
Bei der Description fällt mir spontan kein einfacher Shortcut ein, da
wurde ja bisher implizit die 2. Spalte angenommen für {1} und höhere für
weitere Platzhalter. Man könnte versuchen, einen Kompatibilitätsmodus zu
implementieren, also #DESCRIPTION ohne Index impliziert, dass die
Platzhalter bei {1} beginnnen, was sich auf die 2. Spalte bezieht, und
dann aufwärts.
Die Möglichkeit, im jetzigen Format mehrere Datenfelder zu nutzen (oder
geht das gar nicht?) kollidiert aber dann auf jeden Fall mit
erweiterungen wie der jetzigen, wo das Target in der zweiten Spalte
stehen soll. Oder in der dritten? Oder in der letzten? Da muss man ggf.
genauer werden. Wenn bisher aber eh nur der Wikipedia-Fall wirklich
genutzt wird, kann man das ja auf dem Stand einfrieren und für alles,
was darüber geht, auf das generische Format verweisen.
Was meint ihr?
Viele Grüße,
Kai
Am 07.12.2011 12:14, schrieb Jakob Voss:
> Alexander Haffner schrieb:
>
>> nach Jakob’s Vortrag in Hamburg stehen jetzt auch die Konkordanzen von
>> GeoNames und MusicBrainz unter [1] im BEACON-Format zur Verfügung @Kai
>> sogar mit Semantik :-)
>>
> > [1] https://wiki.d-nb.de/display/DINIAGKIM/Normdaten-Mappings
>
> Hm, das Format ist wohl doch nicht so einfach wie geacht:
>
> ----
> #FORMAT: BEACON
> #PREFIX: http://d-nb.info/gnd/
> #LINK: http://www.w3.org/2002/07/owl#sameAs
> #TARGET: http://musicbrainz.org/artist/
>
> 100140084|7c432bb8-2721-407d-a99f-d77d7a245958
> ----
>
> erzeugt folgendes Tripel:
>
> <http://d-nb.info/gnd/100140084>
> <http://www.w3.org/2002/07/owl#sameAs>
> <http://musicbrainz.org/artist/100140084> .
>
> Eine Alternative wäre
>
> ----
> #FORMAT: BEACON
> #PREFIX: http://d-nb.info/gnd/
> #LINK: http://www.w3.org/2002/07/owl#sameAs
>
> 100140084|http://musicbrainz.org/artist/7c432bb8-2721-407d-a99f-d77d7a245958
>
> ----
>
> Das Problem ist, dass zwei verschiedene lokale Identifier verwendet
> werden. Die Lösung ist bislang nicht dokumentiert und sieht so aus:
>
> ----
> #FORMAT: BEACON
> #PREFIX: http://d-nb.info/gnd/
> #LINK: http://www.w3.org/2002/07/owl#sameAs
> #TARGETPREFIX: http://musicbrainz.org/artist/
>
> 100140084|7c432bb8-2721-407d-a99f-d77d7a245958
> ----
>
> Ich habe das Header-Feld "TARGETPREFIX" im
> beacon-nach-N-Triples-Konverter unter https://gist.github.com/1438869
> eingebaut.
>
> Schöne Grüße
> Jakob
>
--
Kai Eckert
Universitätsbibliothek Mannheim
Stellv. Leiter Abteilung Digitale Bibliotheksdienste
Schloss Schneckhof West / 68131 Mannheim
Tel. 0621/181-2946 Fax 0621/181-2918
More information about the dini-ag-kim-lld
mailing list