Universität Duisburg-Essen (UniDUE)

Datenzentrum in folgenden Clustern der Datendomäne Collections: Contemporary Language

Die Datenressourcen der UniDUE innerhalb von Text+ umfassen Sammlungen gesprochener Sprache, wie sie in Manuskripten und Protokollen des politischen Diskurses enthalten sind. Das charakteristische Korpus des PolMine-Projekts ist eine digitale Sammlung von Parlamentsdebatten im Deutschen Bundestag (Korpus GermaParl). Es ist eine treibende Kraft für textbasierte Forschung in der Politikwissenschaft zu Policy und Politik. Da die in Duisburg erstellten Sprachressourcen linguistisch annotiert sind und sich an die Richtlinien der Text Encoding Initiative (TEI) halten, sind sie auch für die sprachwissenschaftliche und zeitgeschichtliche Forschung sehr relevant. Derzeit werden die Daten über verschiedene Langzeitrepositorien sowie über die Webumgebung des Projekts verbreitet.

Ergänzend zu den Sammlungen bietet die UniDUE zugehörige Software-Tools an. Das polmineR-Paket, das in der statistischen Programmiersprache R implementiert und über das Comprehensive R Archive Network (CRAN) verfügbar ist, gewährleistet, dass eine Umgebung für die Analyse von Parlamentsdebatten funktional und vollständig interoperabel ist. Werkzeuge zur Integration der Analyse der parlamentarischen Rede, einschließlich interaktiver Visualisierungen, sind von Anfang an verfügbar und können leicht an die Anforderungen einzelner Forschungsprojekte angepasst werden. Das PolMine-Projekt ist in einer sich entwickelnden mehrsprachigen Forschungsgemeinschaft zur parlamentarischen Lautsprache sehr aktiv. Mitglieder des Teams sind an europäischen Kooperationen zur Bereitstellung parlamentarischer Daten für die Forschung in der Politik- und Sprachwissenschaft (Parla-CLARIN) beteiligt.