Datendomänen

Digitale Sammlungen, Editionen und lexikalische Ressourcen haben eine lange Tradition in der geisteswissenschaftlichen Forschung. Sie sind mit ausgereiften methodologischen Paradigmen verknüpft, die jeweils charakteristische, aber auch bereichsübergreifende Praktiken der Datenerzeugung, -nutzung, -analyse, -vernetzung und -kuratierung erfordern. Sie sind unabdingbar für eine breite Palette von Fachdisziplinen einschließlich, aber nicht beschränkt auf Linguistik, Literaturwissenschaft, Philologien auch der sog. ‚Kleinen Fächer‘, Philosophie sowie sprach- und textbasierte Forschung in den Sozialwissenschaften und der Politikwissenschaft. Die drei Datendomänen sind außerdem grundlegend für interdisziplinäre Forschungspraktiken der Hermeneutik, Paläographie, Genealogie, Editionsphilologie, Lexikographie und Computerphilologie sowie Computerlinguistik.

Der Name Text+ soll vermitteln, dass sich diese Initiative auf typischerweise textbasierte digitale Forschungsdaten konzentriert, die bzgl. Sprachräumen (auch über Europa hinaus) und Modalitäten von Sprache und Schriftsystemen heterogen sind; das Plus-Zeichen weist darauf hin, dass sprachbasierte Ressourcen auch Ressourcen und Werkzeuge für gesprochene Sprache und für multimodale Daten umfassen. Die zunächst von Text+ adressierten Forschungsdaten gliedern sich in drei Domänen:

Sammlungen

Sprach- und textbasierte Sammlungen

Sprach- und textbasierte Sammlungen umfassen Sammlungen geschriebener, gesprochener oder gebärdeter Sprache und Texte sowie sprach- und textbezogene Experimental- oder Messdaten, die auf Grundlage wissenschaftlicher Kriterien gesammelt wurden. Dazu gehören: Textsammlungen (z. B. von literarischen Texten, Sachtexten, Zeitungs- und Zeitschriftentexten, Interviews, Inschriften, Handschriften, Drucken), mono- und multimodale Aufnahmen z. B. von spontaner und formaler Sprache (z. B. von Reden, Dialogen, Nachrichten, Interviews, Interaktion im Alltag), Sensordaten (z. B. EEG, Eyetracking, Artikulographie), Befragungen, Reaktionszeiten etc.


Lexikalische Ressourcen

Lexikalische Ressourcen sind Daten, die die Verwendung von Wörtern in Sätzen, Texten und multimodaler Kommunikation beschreiben, darunter: Wörterbücher (mehrsprachige Wörterbücher, historische Wörterbücher, Fachwörterbücher), Enzyklopädien, Normdaten, terminologische Datenbanken, Ontologien, Wortlisten, Wortkarten und linguistische Atlanten, Übersetzungswörterbücher (für menschliche oder maschinelle Übersetzung) etc.


Editionen

Editionen sind kritische Repräsentationen historischer Dokumente, wie sie in der geisteswissenschaftlichen Forschung und darüber hinaus verwendet werden. Sie bestehen aus der zuverlässigen methodengeleiteten Bewahrung, Präsentation und Kommentierung aller Arten von Texten in verschiedenen Sprachen und Schriftsystemen. Unter der Vielzahl editorischer Modelle finden sich dokumentarische oder diplomatische Editionen, Editionen zur Entstehungsgeschichte von Dokumenten und historisch-kritische Editionen.

Hier finden Sie eine Liste der an den Partnerinstitutionen von Text+ entstandenen Editionen.

Aus der Fülle der adressierten Forschungsdaten ergibt sich die Notwendigkeit, auf Basis transparenter, breit angelegter wissenschaftsgeleiteter Auswahlkriterien das Portfolio von Text+ initial zu definieren und kontinuierlich auszuweiten.