[dini-ag-kim-lld] Mappings jetzt im BEACON-Format

Kai Eckert eckert at bib.uni-mannheim.de
Wed Dec 7 13:09:40 CET 2011


TARGETREFIX ist ungeschickt formuliert, was ist der Unterschied zu 
TARGET? Du meinst ja, dass bei Angabe des TARGETPREFIX in einer zweiten 
Spalte nach Target-IDs gesucht wird.

Der Ansatz gefällt mir, das ist eine Erweiterung, die sicher auch viele 
haben wollen. Muss man nur aufpassen, dass die Reihenfolge und Bedeutung 
der Felder wirklich klar bleibt. Was mich zu meinem Ansatz zurückbringt, 
ob man nicht doch ein allgemeines Header-Format definieren kann, das auf 
ein beliebiges CSV passt. Ich brainstorme mal:

#FORMAT: BEACON
#PREFIX|1: http://d-nb.info/gnd/
#PREFIX|2: http://musicbrainz.org/artist/
#LINK|1|2: http://www.w3.org/2002/07/owl#sameAs
#DESCRIPTION|1|2: {4} Treffer auf MusicBrainz
#LINK|2|3: rdfs:label

100140084|7c432bb8-2721-407d-a99f-d77d7a245958|Super Typ|23
...

Beim DESCRIPTION Feld bin ich mir gerade nicht sicher, ob das das Feld 
war, wo auch die Anzahl der Treffer in deinen Beispielen ausgegeben 
wurde. Auf jeden Fall könnte man so den Text klar einem Link zuweisen 
durch die Indizierung im Feldnamen, die Platzhalter im text selbst wie 
{5} beziehen sich auf beliebige andere Spalten des CSV.

Indexnummer habe ich mal Informatikeruntypisch ab 1 gestartet, kann man 
drüber diskutieren, wenn man mag.

So wäre das auf jeden Fall generisch. Die nächste Frage ist, ob man es 
für die Standardfälle einfacher machen kann. Zur Abwaärtskompatibilität 
könnte man festlegen:
- #PREFIX ist ein Shortcut für #PREFIX|1
- #TARGET ist ein Shortcut für #PREFIX|2
- #LINK ist ein Shortcut für #LINK|1|2
Bei der Description fällt mir spontan kein einfacher Shortcut ein, da 
wurde ja bisher implizit die 2. Spalte angenommen für {1} und höhere für 
weitere Platzhalter. Man könnte versuchen, einen Kompatibilitätsmodus zu 
implementieren, also #DESCRIPTION ohne Index impliziert, dass die 
Platzhalter bei {1} beginnnen, was sich auf die 2. Spalte bezieht, und 
dann aufwärts.

Die Möglichkeit, im jetzigen Format mehrere Datenfelder zu nutzen (oder 
geht das gar nicht?) kollidiert aber dann auf jeden Fall mit 
erweiterungen wie der jetzigen, wo das Target in der zweiten Spalte 
stehen soll. Oder in der dritten? Oder in der letzten? Da muss man ggf. 
genauer werden. Wenn bisher aber eh nur der Wikipedia-Fall wirklich 
genutzt wird, kann man das ja auf dem Stand einfrieren und für alles, 
was darüber geht, auf das generische Format verweisen.

Was meint ihr?

Viele Grüße,

Kai


Am 07.12.2011 12:14, schrieb Jakob Voss:
> Alexander Haffner schrieb:
>
>> nach Jakob’s Vortrag in Hamburg stehen jetzt auch die Konkordanzen von
>> GeoNames und MusicBrainz unter [1] im BEACON-Format zur Verfügung @Kai
>> sogar mit Semantik :-)
>>
>  > [1] https://wiki.d-nb.de/display/DINIAGKIM/Normdaten-Mappings
>
> Hm, das Format ist wohl doch nicht so einfach wie geacht:
>
> ----
> #FORMAT: BEACON
> #PREFIX: http://d-nb.info/gnd/
> #LINK: http://www.w3.org/2002/07/owl#sameAs
> #TARGET: http://musicbrainz.org/artist/
>
> 100140084|7c432bb8-2721-407d-a99f-d77d7a245958
> ----
>
> erzeugt folgendes Tripel:
>
> <http://d-nb.info/gnd/100140084>
> <http://www.w3.org/2002/07/owl#sameAs>
> <http://musicbrainz.org/artist/100140084> .
>
> Eine Alternative wäre
>
> ----
> #FORMAT: BEACON
> #PREFIX: http://d-nb.info/gnd/
> #LINK: http://www.w3.org/2002/07/owl#sameAs
>
> 100140084|http://musicbrainz.org/artist/7c432bb8-2721-407d-a99f-d77d7a245958
>
> ----
>
> Das Problem ist, dass zwei verschiedene lokale Identifier verwendet
> werden. Die Lösung ist bislang nicht dokumentiert und sieht so aus:
>
> ----
> #FORMAT: BEACON
> #PREFIX: http://d-nb.info/gnd/
> #LINK: http://www.w3.org/2002/07/owl#sameAs
> #TARGETPREFIX: http://musicbrainz.org/artist/
>
> 100140084|7c432bb8-2721-407d-a99f-d77d7a245958
> ----
>
> Ich habe das Header-Feld "TARGETPREFIX" im
> beacon-nach-N-Triples-Konverter unter https://gist.github.com/1438869
> eingebaut.
>
> Schöne Grüße
> Jakob
>

-- 
Kai Eckert
Universitätsbibliothek Mannheim
Stellv. Leiter Abteilung Digitale Bibliotheksdienste
Schloss Schneckhof West / 68131 Mannheim
Tel. 0621/181-2946 Fax 0621/181-2918


More information about the dini-ag-kim-lld mailing list