[Tp-reference] Zwei Beispiele (für unser meeting)

Mi Aug 31 12:52:13 CEST 2022

Konsortien-Beispiel zum Alleinstellungsmerkmal des Konsortiums Text+

Beispiel 1: Data Depositing

Bei den Partnern von Text+ liegt ein reicher Schatz von textuellen 
Daten, Sprachaufnahmen, lexikalischen Daten, etc.  vor. Wenn diese Daten 
über entsprechende Software-Werkzeuge zusammengeführt werden können, 
können weitere Forschungsfragestellungen bearbeitet werden. Dieser 
Schatz geht verloren,wenn die Daten nicht langfristig archiviert und 
bereitgestellt werden können.

Ein Beispiel für Daten aus Text+ sind die digitalen Datenbestände aus 
Forschungsprojekten, die gerade für die geisteswissenschaftliche 
Forschung und die Entwicklung von sprachtechnologischen Modellen einen 
unschätzbaren Wert haben. Diese Wissensquellen können im rechtlichen 
Rahmen gemeinsam für die Forschung und damit auch für die Entwicklung 
eigener Dienste zugänglich gemacht werden.

Text+ bietet der Forschungsgemeinschaft an, Daten aus dem 
Forschungsprozess langfristig zu archivieren und anderen Forschenden 
verfügbar zu machen. Für dieses Angebot stellen Partner innerhalb von 
Text+ abgestufte Data Depositing Dienste zur Verfügung, einschließlich 
spezialisierter, zertifizierter Datenzentren, die qualitätsgesichert 
bestimmte Datentypen entgegennehmen und unmittelbar die Zugänglichkeit 
über weitere Werkzeuge zuleiten. So können z. B. historische Texte in 
einem bestimmten Format qualitätsgesichert archiviert werden und stehen 
unmittelbar für andere Forschende zur Verfügung. Mit der Integration von 
virtuellen Forschungsumgebungen und Software zur Erschließung der Daten 
stehen zusätzliche Forschungswerkzeuge bereits prototypisch zur Verfügung.

Beispiel 2: Verknüpfung qualitativ hochwertiger Wissensquellen mit 
Forschungsdaten

Partner von Text+ bauen seit Jahren gemeinsame Referenzverzeichnisse 
auf, die eine solche Referenzliste ermöglicht. So enthält die Gemeinsame 
Normdatei (GND), die an der Deutschen Nationalbibliothek beheimatet ist, 
eindeutige Identifikatoren für Personen, insbesondere von Autoren, deren 
Werke bei der Deutschen Nationalbibliothek vorhanden sind, darunter auch 
alle Autoren von in Deutschland erschienenen Dissertationen, Büchern, 
etc. Hier werden gleichnamige Autoren unterschieden, aber auch ein 
Verweis auf die jeweiligen Veröffentlichungen hinterlegt. Autoren, die 
z. B. Den Verlag oder die Hochschule wechseln, erhalten nur ein 
Identifikationsmerkmal, so dass sie unabhängig von Wirkungsstätte oder 
über Fachdisziplinen hinaus auch verlinkbar sind. Die Deutsche 
Nationalbibliothek arbeitet hier auch mit weiteren Nationalbibliotheken 
und anderen Organisationen zusammen, etwa mit der  Open Researcher and 
Contributor ID (ORCID) oder der Virtual International Authority File 
(VIAF). Innerhalb von Text+ wird eine GND-Agentur für entsprechende 
Angaben aufgebaut, die für die Daten innerhalb von Text+ eine 
Verknüpfung ermöglichen. Auch Wörterbuchressourcen wie das GermaNet 
können verwendet werden, um Wörter mit unterschiedlicher Bedeutung über 
einen Identifikator zu unterscheiden und so z. B. über Methoden des 
maschinellen Lernens genauere thematische Zuordnungen von Texten zu 
ermöglichen.

-- 
Andreas Witt
http://www1.ids-mannheim.de/zfo/personal/witt.html
+49-171-1768-306

-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://lists.dnb.de/pipermail/tp-reference/attachments/20220831/85c3d7d3/attachment.htm>