[Tp-reference] Zwei Beispiele (für unser meeting)
Andreas Witt
witt at ids-mannheim.de
Mi Aug 31 12:52:13 CEST 2022
Konsortien-Beispiel zum Alleinstellungsmerkmal des Konsortiums Text+
Beispiel 1: Data Depositing
Bei den Partnern von Text+ liegt ein reicher Schatz von textuellen
Daten, Sprachaufnahmen, lexikalischen Daten, etc. vor. Wenn diese Daten
über entsprechende Software-Werkzeuge zusammengeführt werden können,
können weitere Forschungsfragestellungen bearbeitet werden. Dieser
Schatz geht verloren,wenn die Daten nicht langfristig archiviert und
bereitgestellt werden können.
Ein Beispiel für Daten aus Text+ sind die digitalen Datenbestände aus
Forschungsprojekten, die gerade für die geisteswissenschaftliche
Forschung und die Entwicklung von sprachtechnologischen Modellen einen
unschätzbaren Wert haben. Diese Wissensquellen können im rechtlichen
Rahmen gemeinsam für die Forschung und damit auch für die Entwicklung
eigener Dienste zugänglich gemacht werden.
Text+ bietet der Forschungsgemeinschaft an, Daten aus dem
Forschungsprozess langfristig zu archivieren und anderen Forschenden
verfügbar zu machen. Für dieses Angebot stellen Partner innerhalb von
Text+ abgestufte Data Depositing Dienste zur Verfügung, einschließlich
spezialisierter, zertifizierter Datenzentren, die qualitätsgesichert
bestimmte Datentypen entgegennehmen und unmittelbar die Zugänglichkeit
über weitere Werkzeuge zuleiten. So können z. B. historische Texte in
einem bestimmten Format qualitätsgesichert archiviert werden und stehen
unmittelbar für andere Forschende zur Verfügung. Mit der Integration von
virtuellen Forschungsumgebungen und Software zur Erschließung der Daten
stehen zusätzliche Forschungswerkzeuge bereits prototypisch zur Verfügung.
Beispiel 2: Verknüpfung qualitativ hochwertiger Wissensquellen mit
Forschungsdaten
Partner von Text+ bauen seit Jahren gemeinsame Referenzverzeichnisse
auf, die eine solche Referenzliste ermöglicht. So enthält die Gemeinsame
Normdatei (GND), die an der Deutschen Nationalbibliothek beheimatet ist,
eindeutige Identifikatoren für Personen, insbesondere von Autoren, deren
Werke bei der Deutschen Nationalbibliothek vorhanden sind, darunter auch
alle Autoren von in Deutschland erschienenen Dissertationen, Büchern,
etc. Hier werden gleichnamige Autoren unterschieden, aber auch ein
Verweis auf die jeweiligen Veröffentlichungen hinterlegt. Autoren, die
z. B. Den Verlag oder die Hochschule wechseln, erhalten nur ein
Identifikationsmerkmal, so dass sie unabhängig von Wirkungsstätte oder
über Fachdisziplinen hinaus auch verlinkbar sind. Die Deutsche
Nationalbibliothek arbeitet hier auch mit weiteren Nationalbibliotheken
und anderen Organisationen zusammen, etwa mit der Open Researcher and
Contributor ID (ORCID) oder der Virtual International Authority File
(VIAF). Innerhalb von Text+ wird eine GND-Agentur für entsprechende
Angaben aufgebaut, die für die Daten innerhalb von Text+ eine
Verknüpfung ermöglichen. Auch Wörterbuchressourcen wie das GermaNet
können verwendet werden, um Wörter mit unterschiedlicher Bedeutung über
einen Identifikator zu unterscheiden und so z. B. über Methoden des
maschinellen Lernens genauere thematische Zuordnungen von Texten zu
ermöglichen.
--
Andreas Witt
http://www1.ids-mannheim.de/zfo/personal/witt.html
+49-171-1768-306
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://lists.dnb.de/pipermail/tp-reference/attachments/20220831/85c3d7d3/attachment.htm>
Mehr Informationen über die Mailingliste Tp-reference