Akademie der Wissenschaften in Hamburg (AdWHH), Zentrum für Interdisziplinarität und linguistische Diversität in Sprachdaten

Datenzentrum in folgenden Clustern der Datendomäne Collections: Contemporary Language; Historical Texts

Seit ihrer Gründung im Jahr 2004 fördert die AdWHH die interdisziplinäre Forschung zu gesellschaftlich bedeutsamen Zukunftsfragen und grundlegenden wissenschaftlichen Problemen. Darüber hinaus koordiniert die AdWHH derzeit fünf langfristig angelegte Forschungsprojekte im Rahmen des Akademienprogramms (das wiederum von der Union der deutschen Akademien der Wissenschaften koordiniert wird), die jeweils einen starken Fokus auf die digitale Erschließung und Analyse einzigartigen und vielfältigen Sprachmaterials legen. Als prominentes Beispiel ist das Projekt DGS-Korpus zu nennen, das die umfassende Sammlung von Gebärdensprachdaten und deren Zusammenstellung in Form des Öffentlichen DGS-Korpus zum Ziel hat.

Um eine solide Grundlage für die langfristige Verfügbarkeit vielfältiger sprachlicher Ressourcen für weltweite Forschungsgemeinschaften und die interessierte Öffentlichkeit zu schaffen, bereitet die AdWHH derzeit eine gemeinsame Initiative mit dem Zentrum für nachhaltiges Forschungsdatenmanagement (FDM) vor.

Als zentrale Betriebseinheit an der Universität Hamburg stellt das FDM unter anderem eine lokale technische Infrastruktur (einschließlich eines Datenrepositoriums) für nachhaltiges Forschungsdatenmanagement zur Verfügung.

Folgende Expertisen/Ressourcen sollen mit der Text+ Infrastruktur zur Verfügung gestellt werden (mit den Leitern des HH Langzeitvorhaben zu spezifizieren/diskutieren):

Beta maṣāḥǝft Eine systematische Studie der christlichen Manuskripttradition Äthiopiens und Eritreas.
DGS-Korpus Erfasst und dokumentiert systematisch die Deutsche Gebärdensprache (DGS) in ihrer ganzen Vielfalt und erstellt auf der Grundlage der Korpusdaten ein elektronisches Wörterbuch.
Etymologika Kritische Ausgabe, Übersetzung und Kommentierung der griechischen Enzyklopädie „Etymologicum Gudianum“. Erforschung der reichen Manuskriptproduktion griechisch-byzantinischer etymologischer Enzyklopädien und Präsentation der Ergebnisse in einer gedruckten und umfangreichen digitalen Version.
INEL Corpus Indigene nordeurasische Sprachen (INEL): Bereitstellung von Sprachressourcen für indigene Sprachen und Schaffung einer digitalen Forschungsinfrastruktur für die Nutzung dieser Ressourcen. Ausführlich kommentierte, beschönigte und zum größten Teil audio-alignierte Korpora der Sprachen Dolgan, Kamas und Selkup. Während der vorgesehenen Förderperiode werden Korpora weiterer Sprachen (z.B. Evenkisch, Nenzisch, etc.) folgen.
Formulae – Litterae – Chartae Erforschung und kritische Edition der frühmittelalterlichen Formulae sowie Zugriffsmöglichkeiten zu diesen über eine digitale Forschungsinfrastruktur, die eine Erforschung der Formulae-Schrift in Westeuropa vor der Entwicklung der ars dictaminis auf der Grundlage von Briefen und Urkunden ermöglicht.