Daten aus der Community

Angebote für Forschungsdaten zur Integration im Rahmen von Text+

Running Call: Direktlink zum Abgeben von Angeboten für Forschungsdaten

Mit Ihnen zusammen möchten wir den reichen Schatz an Forschungsdaten und Anwendungsmöglichkeiten, den die Geisteswissenschaften und weitere Disziplinen bieten, sichten und produktiv in die NFDI-Initiative Text+ einbringen. Gerade durch die Vielfalt und Menge der Forschungsdaten sowie eine große Bandbreite an Forschungsfragen soll eine stabile und facettenreiche Basis für eine Forschungsdateninfrastruktur geschaffen werden.

Innerhalb der Initiative Text+ werden drei Datendomänen unterschieden: Editionen, Lexikalische Ressourcen und Sammlungen. In diesen Datenbereichen können Sie die Initiative durch Ihre Angebote an Forschungsdaten, Forschungsfragen und Forschungsaufgaben bereichern.

Die geisteswissenschaftliche Community in ihrer Vielfalt ist für Text+ der wichtigste Bezugspunkt und wir möchten sie durch Ihre Mithilfe repräsentieren. Wir möchten Sie daher zur Mitarbeit und Mitgestaltung im Rahmen der NFDI einladen.

Ihre Forschungsdaten können das Angebot von Text+ ergänzen und in den Pool repräsentativer Datenbestände für Text+ aufgenommen werden. In der Governance von Text+ ist vorgesehen, dass die wissenschaftliche Koordination und Weiterentwicklung der drei Datendomänen von Text+ ausschließlich in den Händen von Fachwissenschaftlerinnen und ‑wissenschaftlern liegen soll. Diese Weiterentwicklung wird auf Grundlage des Datenpools erfolgen. Um einen strukturierten Überblick zu den für die Community relevanten Datenbeständen zu erhalten, haben wir einen Fragebogen erstellt.

Rückmeldung bis 16. August 2020 konnten in die Antragsvorbereitung einbezogen werden. Weiterhin sind Einreichungen über unser Online-Formular möglich. Für Rückfragen wenden Sie sich bitte an office[at]text-plus.org.


Ergebnisse des Daten-Calls

Im Folgenden präsentieren wir einige der Daten, die aus der Community zur Integration in die Text+-Infrastructure vorgeschlagen wurden.

Tailored Corpora and Topic Models for Japanese Parliamentary Minutes (provisional title)

Institution(en)Deutsches Institut für Japanstudien
Datendomäne(n)Sammlungen, Lexikalische Ressourcen, Software Services
Sprache(n)Japanisch
Modalität(en)geschrieben
Fächer (DFG)102104106111
Fächer (beschreibend)Japanologie, Ostasienwissenschaften, Geschichte (insb. Begriffsgeschichte), Politikwissenschaft, Linguistik

Das Kokkai (japanische Parlament) hat alle Reden seit 1947 über eine XML-Schnittstelle veröffentlicht. Die enorme Anzahl von Texten ermöglicht es, die Entwicklung von Konzepten (sofern sie japanischen Wörtern entsprechen) im Diskurs zu verfolgen, wenn Methoden des Fernlesens angewendet werden. Am Deutschen Institut für Japanstudien (DIJ) werden solche Analysen mit LDA-Topic-Models durchgeführt. Zusätzlich zu den Modellen werden bei der systematischen Analyse auch Metadaten verwendet, die über die öffentliche Schnittstelle (wie Datum, Ausschuss, Name des Sprechers) und darauf basierende benutzerdefinierte Datenstrukturen (wie Netzwerke) bereitgestellt werden.

Soldatenbriefe des 18. und 19. Jahrhunderts

Institution(en)Justus-Liebig-Universität Gießen, Institut für Germanistik
Datendomäne(n)Editionen, Sammlungen
Sprache(n)Deutsch (differenziert in: Norddeutsch, Nordoberdeutsch, Ostmitteldeutsch, Ostoberdeutsch, Westmitteldeutsch, Westoberdeutsch)
Modalität(en)geschrieben
Fächer (beschreibend)Linguistik, Literaturwissenschaft, Kulturwissenschaft, Editionsphilologie, Geschichte, Militärgeschichte, (Neue) Politische Geschichte; (ggf., nach Aufbereitung der Forschungsdaten) Korpuslinguistik, Computerlinguistik

170 „Soldatenbriefe“ aus den Jahren 1745 bis 1872; die Briefe stammen zu einem kleinen Teil aus älteren (nicht mehr urheberrechtlich geschützten), aber zuverlässigen Editionen, vor allem aber aus eigener Archivarbeit, wurden also vom Herausgeber Marko Neumann erstmals nach der Handschrift transkribiert und veröffentlicht. Diese sind über die Webseite des Heidelberger Universitätsverlags Winter verfügbar und können von dort kostenfrei heruntergeladen werden. Dieses Korpus ist sowohl aus linguistischer als auch aus historischer, insbesondere kultur‑, literatur- und militärgeschichtlicher Perspektive höchst wertvoll.

Zu den Hürden (aus rechtlicher Sicht) und Schwierigkeiten (mit Blick auf Publikationsform und v.a. das Datenformat) für die Nachnutzung dieser wertvollen Daten vgl. die zu diesem Datenangebot gehörige User Story “Soldatenbriefe des 18. und 19. Jahrhunderts: Von der PDF-Edition zu nachnutzbaren, interoperablen Forschungsdaten”.

Erschließung des Korrespondenz der Constance de Salm (1767–1845)

Institution(en)Deutsches Historisches Institut Paris
Datendomäne(n)Editionen
Sprache(n)Deutsch
Modalität(en)geschrieben
Fächer (DFG)102104105
Fächer (beschreibend)Geschichte, Sprachwissenschaften, Literaturwissenschaften

Es handelt sich um die Metadaten, mit denen die Korrespondenz der Constance de Salm (rund 11.000 Briefe) in einem langjährigen Projekt des Deutschen Historischen Instituts Paris inhaltlich und formal erschlossen wurden. Neben Empfänger- und Sendedaten wie Person, Ort und Datum gibt es eine inhaltliche Erschließung über Schlagworte.

JudaicaLink

Institution(en)Hochschule der Medien, Stuttgart
Datendomäne(n)Lexikalische Ressourcen, Software Services
Sprache(n)Deutsch, Englisch, Hebräisch, Russisch
Modalität(en)geschrieben
Fächer (DFG)102106107
Fächer (beschreibend)Judaistik, Theologie, Geschichtswissenschaften 

JudaicaLink ist ein RDF-basierter Knowledge-Graph, der Daten aus unterschiedlichen Quellen im Bereich Judaistik integriert. Dazu gehören vor allem Lexika und Biographien, Verlinkungen bestehen zu GDN, DBpedia/Wikipedia, Wikidata und vielen weiteren Datenquellen. Die Daten werden im FID Jüdische Studien genutzt, um Querverbindungen in Metadaten und aktuell auch Volltexten herzustellen. 

LTA – Latin Text Archive (mit FFL Frankfurt Latin Lexicon)

Institution(en)Goethe-Universität Frankfurt am Main
Datendomäne(n)Editionen, Sammlungen, Lexikalische Ressourcen
Sprache(n)Latein
Modalität(en)geschrieben
Fächer (DFG)101102104105107113
Fächer (beschreibend)Theologie, Geschichte, historische Kulturwissenschaften, Rechtswissenschaften, Romanistik, Mittelalterliche Lateinische Philologie, Linguistik

Das LTA ist ein frei zugängliches, webbasiertes analytisches Archiv von (großenteils) hochwertigen kritischen Editionen lateinischer Texte, die mit komplexen Metadaten versehen, vollständig lemmatisiert und mit einem Vollformen-Lexikon (FLL) verknüpft sind. Es bietet diachronisch organisierte Referenzkorpora nach Textgenres und Text Mining-Tools für die individuelle Korpusbildung und ‑analyse. Größe und Vielfalt des Inhalts ermöglichen es Forschern, zuverlässige diachrone Korpora (z. B. aus nur einem Texttyp) zur Analyse zu erstellen. Es umfasst die Textproduktion im lateinischsprachigen Europa von 400 bis 1500, wird aber kontinuierlich erweitert. Technisch basiert das LTA auf dem DTA (Deutsches Textarchiv).

Medizinische Gutachten des 17. und 18. Jahrhunderts

Institution(en)Katholische Universität Eichstätt-Ingolstadt
Datendomäne(n)Sammlungen
Sprache(n)Deutsch mit lateinischen und griechischen Einsprengseln
Modalität(en)geschrieben
Fächer (DFG)102103
Fächer (beschreibend)Sprachwissenschaft (v.a. Sprachgeschichte, Textlinguistik, Fachsprachenforschung), Medizingeschichte, Wissenschaftsgeschichte, Rechtsgeschichte, Kulturgeschichte

Es handelt sich um ein Textkorpus, das 150 transkribierte medizinische Gutachten des 17. und 18. Jahrhunderts aus gedruckten medizinischen Fallsammlungen enthält. Die Texte liegen als Plain-Text-Dateien vor, weisen rudimentäre Annotationen (Zeilenumbruch und Seitenumbruch) auf, aber nur knappe bibliographische Angaben (keinen TEI-konformen Header!).

Dokumente und Materialien zur ostmitteleuropäischen Geschichte

Institution(en)Herder-Institut für historische Ostmitteleuropaforschung – Institut der Leibniz-Gemeinschaft
Datendomäne(n)Editionen
Sprache(n)mehrsprachig
Modalität(en)geschrieben
Fächer (DFG)102
Fächer (beschreibend)Primär: Universitäre Lehre (Dozierende, Studierende der historischen Wissenschaften), sekundär: interessierte Öffentlichkeit

Die digitale Edition bietet Themenmodule für die universitäre Lehre zur ostmitteleuropäischen Geschichte in ihrer zeitlichen Tiefe und räumlichen Breite an, so dass Themenmodule zur mittelalterlichen Geschichte ebenso angeboten werden wie zur Zeitgeschichte. Alle Textquellen, aber auch andere Materialien wie Statistiken werden zur Sicherung der Zitierfähigkeit in der jeweiligen Originalsprache, in deutscher Übersetzung und möglichst als Scan aus der Originalquelle angeboten, außerdem werden weitere Materialien wie Karten, Abbildungen, eine Auswahlbibliografie mit Literatur in westlichen Sprachen und eine Chronologie zur Orientierung angeboten. Sämtliche Module unterliegen einem Double-blind-peer-review-Verfahren. Das Angebot wird ständig erweitert, überarbeitet und derzeit wird ein englischsprachiges Angebot erarbeitet.

New Testament Virtual Manuscript Room (NTVMTR) – ECM digital

Institution(en)Westfälische Wilhelms-Universität Münster, Institut für neutestamentliche Textforschung
Datendomäne(n)Editionen, Sammlungen
Sprache(n)Griechisch, Deutsch, Englisch
Modalität(en)geschrieben
Fächer (DFG)102104105107
Fächer (beschreibend)Philologien, Theologie, Editionswissenschaft, Papyrologie

Im Virtuellen Handschriften-Lesesaal (Virtual Manuscript Room = VMR) wird die herkömmliche Kurzgefaßte Liste der griechischen Handschriften ergänzt durch alle Informationen, die zu den einzelnen Handschriften vorhanden sind. Vor allem werden, soweit die besitzenden Institutionen zustimmen, Fotos der Manuskripte über eine entsprechende Website zur Verfügung gestellt. Zu diesem Zweck werden die Mikrofilmbestände des INTF gescannt (z.T. auch neue Fotos beschafft) und inhaltlich so erschlossen, dass sie mit den im INTF erstellten Transkripten der Handschriften verbunden werden. Links verweisen auch auf anderweitig im Netz bereitgestellte Fotos und Informationen. Der VMR ist inzwischen zu einer interaktiven Editionsplattform ausgebaut werden und dient als Arbeitsgrundlage für die im INTF erstellte Editio Critica Maior (ECM) des griechischen Neuen Testaments, kann aber auch für andere textkritische Editionen handschriftlich überlieferter Werke genutzt werden. Zur Zeit wachsen ECM und VMR zu einer interaktiven kritischen Edition des Neuen Testaments zusammen.

Niedersorbische Textkorpora

Institution(en)Sorbisches Institut, Bautzen
Datendomäne(n)Sammlungen
Sprache(n)Niedersorbisch
Modalität(en)geschrieben
Fächer (beschreibend)Sprachwissenschaft, Geschichtswissenschaft, Kulturwissenschaft, Computerlinguistik, Digital Humanities

Unterschieden werden ein „altes“ sowie ein „neues“ Textkorpus (im Aufbau). Beide Korpora sind mit verschiedenen Zugriffsmethoden verbunden. Die Datengrundlage für letzteres umfasst zurzeit (2020) ca. 43 Millionen Tokens. Die Texte werden schrittweise annotiert (u.a. Normalisierung/Lemmatisierung). Die Suche erfordert keine vertieften Kenntnisse über die historische Schreibung und Formenvielfalt, greift aber aktuell noch auf wenig Texte zu. Das alte Textkorpus umfasst mehr als 23 Millionen Tokens, wovon ca. 15 Millionen online zur Verfügung stehen. Die Texte sind nicht annotiert und kaum weiter verarbeitet, es liefert ausschließlich die Originalschreibweise. Außerdem sind die Texte nicht korrigiert, so dass mit (Ab-)Schreibfehlern zu rechnen ist. 

APWCF, APWCD: Linguistisches Korpus der Acta Pacis Westphalicae, französische und deutsche Korrespondenzen

Institution(en)Universität Potsdam, Lehrstuhl für romanische Sprachwissenschaft (Französisch und Italienisch)
Datendomäne(n)Sammlungen
Sprache(n)Vorwiegend Deutsch und Französisch, Italienisch, teils Latein, zahlreiche anderssprachige Einschübe
Modalität(en)geschrieben
Fächer (DFG)102103104
Fächer (beschreibend)Linguistik, Geschichte, Rechtsgeschichte, Geschichte internationaler Beziehungen, Kulturgeschichte

Es handelt sich um ein linguistisches Korpus auf Basis der digitalen Edition der Acta Pacis Westphalicae (APW). Für diese Nachnutzung und die nicht-kommerzielle Datenpublikation liegen schriftliche Genehmigungen der rechteinhabenden Institutionen vor. Aus linguistischer Sicht ist diese ursprünglich für die Historiographie aufbereitete Ressource äußerst wertvoll: die deutschen, französischen, oft mehrsprachigen fachsprachlichen oder informellen Textsorten repräsentieren unterschiedliche Register einer wichtigen Sprachwandelphase. Die Editionskriterien verzeichnen minimale Eingriffe in den Originaltext. Als Korpus (Auszeichnung von Metadaten, Trennung von Textdaten) bisher verfügbar: Französische Korrespondenzen der Acta Pacta Westphalicae (1644–1647), annotiert mit TreeTagger Parameter für das klassische Französisch des Projekts PRESTO (DFG/ANR), 2.640.000 Tokens Deutsche Korrespondenzen der Acta Pacta Westphalicae (1643–1648), ca. 835.000 Tokens, noch nicht annotiert

Berliner Papyrusdatenbank

Institution(en)Ägyptisches Museum und Papyrussammlung – Staatliche Museen zu Berlin
Datendomäne(n)Sammlungen
Sprache(n)Deutsch, Altgriechisch, Lateinisch
Modalität(en)geschrieben
Fächer (DFG)101104106113
Fächer (beschreibend)als Teil des weltweiten papyrologischen Datenbanknetzwerks ist die Berliner Papyrusdatenbank von zentraler Bedeutung für alle Fächer des Bereichs 101 „Alte Kulturen“ der DFG-Fächersystematik (insb. Alte Geschichte, Klassische Philologie, Ägyptologie) und weit darüber hinaus (z.B. vergleichende Sprachwissenschaften, Religionswissenschaften, Rechtswissenschaften u.ä.).

Es handelt sich um eine ständig erweiterte und aktualisierte Datenbank der griechisch- und lateinischsprachigen Bestände der Berliner Papyrussammlung, die die größte ihrer Art in Deutshcland und zu den fünf größten weltweit zählt. Neben den Metadaten (z.B. Inhalt, Datierung, Herkunft, Publikationen und Erwerbungsgeschichte) und hochauflösenden Bildern werden Verlinkungen zu weiterführenden Informationen anderer Datenbanken und Projekte angeboten.

Bibliothek für Bildungsgeschichtliche Forschung (BBF)

Institution(en)DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation
Datendomäne(n)Editionen
Sprache(n)Deutsch
Modalität(en)geschrieben
Fächer (DFG)102109
Fächer (beschreibend)Geschichte, Erziehungswissenschaften, …

Die Bibliothek für Bildungsgeschichtliche Forschung stellt die Briefe Friedrich Fröbels und den Briefwechsel zwischen Eduard Spranger und Käthe Hadlich als Online-Edition bereit. Enthalten sind 6.251 Dokumente aus den Jahren 1799–1852 (Fröbel-Edition) und 1903–1960 (Spranger-Hadlich). Über ein Personen- und Jahresregister kann auf die Briefe zugegriffen werden. Die Texte sind nach den Richtlinien der Text Encoding Initiative (TEI) ausgezeichnet. Derzeit wird die Migration der Edition in den TEI-Publisher vorbereitet.

CrossAsia ITR (Integriertes Textrepositorium)

Institution(en)CrossAsia und Fachinformationsdienst Asien, Staatsbibliothek zu Berlin – Preußischer Kulturbesitz
Datendomäne(n)Sammlungen, Software Services
Sprache(n)Chinesisch, Englisch, Japanisch, Deutsch, Niederländisch, Französisch, Spanisch, Koreanisch, Thai, Laotisch
Modalität(en)geschrieben
Fächer (DFG)103106
Fächer (beschreibend)alle Geistes- und Sozialwissenschaften mit Asienbezug, insb. Asienwissenschaften (Sinologie, Japanologie, Koreanistik, Südostasienwissenschaften, Zentralasienwissenschaften (Tibetologie, Mongolistik, Uyghur studies), Südasienwissenschaften, Indologie), bzw. Regionalstudien mit Asienbezug, Reliogionswissenschaften (Buddhologie), ostasiatische Kunstgeschichte, etc.

Im „Integrierten Text-Repositorium“ CrossAsia ITR werden Bild- und Textdaten, der für den FID Asien und CrossAsia lizenzierten Datenbanken, für die Hosting‑, Indexierungs- und Textmining-Rechte vereinbart werden konnten, sowie gemeinfreie Texte und Bilddaten wie Fotographien zusammen mit ihren Erschließungsdaten sicher und nachhaltig archiviert, mit dem Ziel, diese gleichberechtigt nebeneinander gemäß der FAIR-Prinzipien anbieten zu können. Enthalten sind aus dem Textbereich mit aktuellem Stand (August 2020) Volltexte von ca. 335.000 Titeln mit 53 Mio. Seiten aus 26 verschiedenen überwiegend chinesisch- und englischsprachigen lizenzpflichtigen Datenbanken sowie gemeinfreie Texte der Asienkollektion der Digitalisierten Sammlungen der SBB-PK in westlichen sowie asiatischen Sprachen. Eine Ressourcenliste findet sich hier.

Database of Cross-Linguistic Colexifications (CLICS)

Institution(en)Max-Planck-Institut für Menscheitsgeschichte
Datendomäne(n)Lexikalische Ressourcen, Software Services
Sprache(n)mehrsprachig
Modalität(en)geschrieben, transkribiert
Fächer (DFG)104110206
Fächer (beschreibend)historische Linguistik, linguistische Typologie, Psychologie, Neurowissenschaften

Die ursprüngliche Datenbank für sprachübergreifende Colexifikationen (CLICS) hat ein computergestütztes Framework für die interaktive Darstellung sprachübergreifender Colexifikationsmuster eingerichtet. Es hat sich als nützliches Instrument für verschiedene Arten der Untersuchung sprachübergreifender semantischer Assoziationen erwiesen, angefangen von Studien zum semantischen Wandel über Muster der Konzeptualisierung bis hin zur sprachlichen Paläontologie. CLICS wurde aber auch wegen offensichtlicher Mängel kritisiert. Aufbauend auf den Standardisierungsbemühungen der CLDF-Initiative und neuartigen Ansätzen für eine schnelle, effiziente und zuverlässige Datenaggregation hat CLICS² die ursprüngliche CLICS-Datenbank erweitert. CLICS³ – die dritte Ausgabe von CLICS – nutzt das in CLICS² entwickelte Framework, um die in der Datenbank aggregierte Datenmenge mehr als zu verdoppeln.

Datenbank mit Nachweisen romanistischer Forschungsdaten

Institution(en)Fachinformationsdienst Romanistik
Datendomäne(n)Software Services
Sprache(n)Deutsch, Sacherschließung teilweise zusätzlich Französisch
Modalität(en)gesprochen, geschrieben
Fächer (DFG)101–02104105106108
Fächer (beschreibend)Romanistik (Literaturwissenschaft, Sprachwissenschaft, Kultur- und Medienwissenschaft, Fachdidaktik)

Datenbank auf der Basis von Academic LinkShare, in der u.a. Forschungsdaten nach Dublin Core formal und sachlich beschrieben werden. Die Sacherschließung umfasst die Vergabe von GND-Schlagwörtern, von DDC-Hauptklassen, Klassifikationen nach Regionen und Ressourcentyp sowie Abstracts. Auszüge lassen sich nach Bedarf generieren und können separat auf einzelnen Webseiten präsentiert werden. Die Daten sind inzwischen auch in den Index des FID-Suchportals integriert worden (derzeit noch testweise) und darüber recherchierbar. 

Datenbank und Meldeformular für romanistische Forschungsdaten

Institution(en)Fachinformationsdienst Romanistik, romanistik​.de e.V.
Datendomäne(n)Software Services
Sprache(n)Deutsch
Fächer (DFG)104105
Fächer (beschreibend)Primär Romanistik bzw. Disziplinen, in denen Daten mit romanistischer Relevanz anfallen

Von romanistik​.de, der AG Digitale Romanistik und dem FID Romanistik entwickeltes Meldeformular auf der romanistischen Kommunikationsplattform romanistik​.de, das es erlaubt, auf eigene Forschungsdaten wie auf traditionelle Publikationen aufmerksam zu machen. Gemeldete Forschungsdaten sind dann über die Plattform auffindbar und werden auch über den romanistik.de-Newsletter beworben.

Digitale und Retrodigitalisierte niedersorbische Wörterbücher

Institution(en)Sorbisches Institut
Datendomäne(n)Lexikalische Ressourcen
Sprache(n)Niedersorbisch, Deutsch
Modalität(en)geschrieben
Fächer (DFG)101–02104105106108
Fächer (beschreibend)Sorabistik, Slawistik, Lexikografie, Sprachwissenschaft, Kulturwissenschaft

Einheitliche Internetversion vierer retrodigitalisierter niedersorbisch-deutscher Wörterbücher auf Basis fein-granular semantisch-strukturell modellierter XML-Dateien. Außerdem: Digitales aktives Deutsch-niedersorbisches Wörterbuch. Diese lexikalischen Ressourcen werden zunehmend über gemeinsame Suchschnittstellen miteinander verbunden.

Europäische Religionsfrieden Digital (EuReD) – Digitale Quellenedition frühneuzeitlicher Religionsfrieden

Institution(en)Leibniz-Institut für Europäische Geschichte (IEG); Universitäts- und Landesbibliothek Darmstadt
Datendomäne(n)Editionen
Sprache(n)Deutsch, Latein, Französisch, Englisch, Tschechisch, Ungarisch, Polnisch, Italienisch, Niederländisch, Dänisch, Schwedisch, evtl. Russisch
Modalität(en)geschrieben
Fächer (DFG)102103104105107
Fächer (beschreibend)Historische Friedensforschung; Kulturgeschichte; Rechtsgeschichte; Kirchen- und Theologiegeschichte; Editionswissenschaft

Mit der Quellenedition wird erstmals eine Textbasis für die vergleichende Erforschung vormoderner, religionsbezogener Friedensstiftung in Europa bereitgestellt. Die mit ausführlichen Einleitungen und Kommentaren versehene Edition umfasst die Zeitspanne von 1485 (Kuttenberger Frieden) bis 1788 (Woellnersches Religionsedikt). Grundlage der Ausgabe sind die Texte in ihrer zuerst veröffentlichten und rezipierten Form (editio princeps). Die Edition ist born-digital und verwendet die XML/TEI-p5-Standards.

Fallada-Archiv

Institution(en)Karlsruher Institut für Technologie, Institut für Germanistik
Datendomäne(n)Editionen, Sammlungen
Sprache(n)Deutsch, teilweise Englisch
Modalität(en)geschrieben
Fächer (beschreibend)Literaturwissenschaft, Editionsphilologie, Rezeptionsforschung, Zeitschriftenforschung, Kulturwissenschaft, Textlinguistik, Geschichtswissenschaft, Soziologie

Das Korpus besteht aus:

  • Bibliographie zum Autor Hans Fallada (1893–1947), die alle Primärtexte, Bearbeitungen, Rezensionen und den aktuellen Stand der Forschung listet.
  • Digitalisate schwer zugänglicher journalistischer und literarischer Beiträge Falladas sowie der Erstdrucke seiner Romane, die in verschiedenen Zeitungen und Zeitschriften in Fortsetzungen erschienen sind.
  • Digitalisate zeitgenössischer Rezensionen zu Fallada.

Das Korpus dieser Texte ist derzeit auf viele verschiedene Archive und Bibliotheken verteilt und zum Großteil nicht digital zugänglich.

GEI-Digital – Die digitale Schulbuch-Bibliothek

Institution(en)Georg-Eckert-Institut – Leibniz-Institut für internationale Schulbuchforschung
Datendomäne(n)Editionen, Sammlungen
Sprache(n)Deutsch
Modalität(en)geschrieben
Fächer (DFG)102103104105109111
Fächer (beschreibend)Bildungsmedienforschung, (Neuere) Geschichte, Kulturgeschichte, Literaturwissenschaft, Soziologie, Deutsche Philologie, ggf. (historische) Linguistik

GEI-Digital bietet freien Zugang zu digitalisierten historischen deutschen Lehrbüchern aus der Zeit vor 1918 über digitale Bilder, OCR-Volltext und umfangreiche Metadaten. Es erlaubt die gezielte Volltextsuche in vorhandenen digitalisierten Sammlungen. Es enthält derzeit mehr als 6.300 Bände deutschsprachiger Lehrbücher, hauptsächlich Lesefibeln und den Fächern „Realienkunde“ (grundlegende Sozial- und Naturwissenschaften), Geographie und Geschichte.

Indices zur sprachlichen und literarischen Bildung in Deutschland

Institution(en)Dr. Uwe Grund, Hannover
Datendomäne(n)Sammlungen
Sprache(n)Deutsch
Modalität(en)geschrieben
Fächer (DFG)104105109
Fächer (beschreibend)Germanistik, Erziehungswissenschaft

Die fünfbändige Druckfassung der INDICES (München usw.: Saur, 1991ff) verzeichnet und erschließt ca. 10.000 Dokumente von rund 3.000 Verfassern in fünf führenden Fachzeitschriften und zwei paradigmatischen Amtsblättern. Die Daten beruhen auf der Autopsie von rund 100.000 Druckseiten. Die seriellen Quellen (von ca. 1910 bis ca. 1970) werden mehrdimensional beschrieben (Textgenre / Inhaltsschwerpunkt / Verfahren der Verfasser). Sowohl Extraktions- wie Annotationsverfahren (via Thesaurus) kommen zu Anwendung. Steuerung und Qualitätssicherung (einheitliche Erschließungstiefe, Verknüpfbarkeit und Sortierbarkeit der Datensätze nach chronologischen, alphabetischen und taxonomischen Kriterien) erfolgte über eigens erstelllte Regelwerke zur Datenerfassung, ‑auswertung und ‑weiterverarbeitung (unpubliziert). Einzelne Dateien zu monographischen Quellen (z.B. Lesebücher, Sprachbücher) liegen in Rohfassung vor.

Niklas-Luhmann-Archiv

Institution(en)Universität Bielefeld, Fakultät für Soziologie
Datendomäne(n)Editionen, Sammlungen
Sprache(n)Deutsch, Englisch, Italienisch, Spanisch
Modalität(en)geschrieben, gesprochen
Fächer (beschreibend)Soziologie, Philosophie, Rechtswissenschaft, Erziehungswissenschaft, Literaturwissenschaft, Religionswissenschaft, Politikwissenschaft, Organisationswissenschaft, Wissenschaftsgeschichte

Wissenschaftlicher Nachlass des Soziologen Niklas Luhmann (1927–1998), einem der bedeutendsten Soziologen des 20. Jahrhunderts. Erschließung, Transkription, Edition und Digitalisierung des Zettelkastens mit ca. 90.000 Notizen, der nachgelassenen Manuskripte und anderer Materialien (u.a. Audio- und Videoaufnahmen von Vorträgen und Interviews).

Presseausschnitte online

Institution(en)Herder-Institut für historische Ostmitteleuropaforschung – Institut der Leibniz-Gemeinschaft
Datendomäne(n)Sammlungen, Software Services
Sprache(n)hauptsächlich Deutsch
Modalität(en)geschrieben
Fächer (DFG)102103111
Fächer (beschreibend)Geschichte, Zeitgeschichte, Politik, Medienwissenschaft

Über 5 Millionen Ausschnitte dokumentieren die Geschichte, Politik, Kultur und Wirtschaft Ostmitteleuropas von 1916 bis heute. Wir haben uns insbesondere auf eine systematische Analyse regionaler und nationaler Tages- und Wochenzeitungen aus Ostmitteleuropa und dem deutschsprachigen Raum für den Zeitraum von 1952 bis März 1999 konzentriert. Wir bieten umfassende Archive zu Personen, Orten und Themen. Sie können als einzigartige Dokumentation des sozialistischen Experiments in Osteuropa verwendet werden. Rund 10.000 Ausschnitte über Personen sind bereits digitalisiert und mit Metadaten kombiniert, 6.500 davon zusätzlich mit Schrifterkennung behandelt.

Zusammenstellung von Sprachkorpora aus der Romania

Institution(en)Verschiedene Anbieter, zusammengestellt vom Fachinformationsdienst Romanistik
Datendomäne(n)Sammlungen, Lexikalische Ressourcen
Sprache(n)Romanische Sprachen (v.a. Französisch, Italienisch, Portugiesisch, Rumänisch, Spanisch); auch weitere Sprachen, bspw. Übersetzungen, können enthalten sein, z.B. Englisch, Gebärdensprachen
Modalität(en)vornehmlich geschrieben, teilweise gesprochen als Audio- bzw. gebärdet als Video-Korpora mit oder ohne Transkription.
Fächer (DFG)101–02104105106108
Fächer (beschreibend)Romanistik, Sprachwissenschaft, weitere mit Texten arbeitende Disziplinen

Die Beschreibung der einzelnen Datensätze ist dem jeweiligen Katalogisat zu entnehmen, das neben einer formalen Titelaufnahme (Dublin Core) in der Regel eine umfassende sachliche Erschließung mit GND-Schlagwörtern, DDC-Hauptklassen und Abstracts enthält. Erfasst wird auch die betroffene Sprache, was eine Filterung nach Einzelsprachen erlaubt.

Zusammenstellung von Volltextsammlungen aus der Romania (Editionen)

Institution(en)Verschiedene Anbieter, zusammengestellt vom Fachinformationsdienst Romanistik
Datendomäne(n)Editionen
Sprache(n)Hauptsächlich romanische Sprachen (v.a. Französisch, Italienisch); vereinzelt können auch weitere Sprachen, beispielsweise Übersetzungen, enthalten sein
Modalität(en)vornehmlich geschrieben
Fächer (beschreibend)Romanistik (Literaturwissenschaft, Sprachwissenschaft, Kultur- und Medienwissenschaft, Fachdidaktik), interdisziplinär arbeitende Philologien, Kultur- und Medienwissenschaften, Sozialwissenschaften, Digital Humanities

Die Beschreibung der einzelnen Datensätze ist dem jeweiligen Katalogisat zu entnehmen, das neben einer formalen Titelaufnahme (Dublin Core) i.d.R. eine umfassende sachliche Erschließung mit GND-Schlagwörtern, DDC-Hauptklassen und Abstracts enthält. Erfasst wird auch die betroffene Sprache, was eine Filterung nach Einzelsprachen erlaubt.

Zusammenstellung von Volltextsammlungen aus der Romania (Sammlungen und Editionen)

Institution(en)Verschiedene Anbieter, zusammengestellt vom Fachinformationsdienst Romanistik
Datendomäne(n)Editionen, Sammlungen
Sprache(n)Hauptsächlich romanische Sprachen (v.a. Französisch, Italienisch, Portugiesisch, Spanisch); vereinzelt können auch weitere Sprachen, bspw. Übersetzungen, enthalten sein
Modalität(en)vornehmlich geschrieben
Fächer (beschreibend)Romanistik (Literaturwissenschaft, Sprachwissenschaft, Kultur- und Medienwissenschaft, Fachdidaktik), interdisziplinär arbeitende Philologien, Kultur- und Medienwissenschaften, Sozialwissenschaften, Digital Humanities

Die Beschreibung der einzelnen Datensätze ist dem jeweiligen Katalogisat zu entnehmen, das neben einer formalen Titelaufnahme (Dublin Core) in der Regel eine umfassende sachliche Erschließung mit GND-Schlagwörtern, DDC-Hauptklassen und Abstracts enthält. Erfasst wird auch die betroffene Sprache, was eine Filterung nach Einzelsprachen erlaubt.

Zusammenstellung von lexikographischen Projekten aus der Romania

Institution(en)Verschiedene Anbieter, zusammengestellt vom Fachinformationsdienst Romanistik
Datendomäne(n)Lexikalische Ressourcen
Sprache(n)Romanische Sprachen (v.a. Französisch, Italienisch)
Modalität(en)in der Regel geschrieben
Fächer (beschreibend)Romanistik (Literaturwissenschaft, Sprachwissenschaft, Kultur- und Medienwissenschaft, Fachdidaktik), interdisziplinär arbeitende Philologien, Kultur- und Medienwissenschaften, Sozialwissenschaften, Digital Humanities

Die Beschreibung der einzelnen Datensätze ist dem jeweiligen Katalogisat zu entnehmen, das neben einer formalen Titelaufnahme (Dublin Core) i.d.R. eine umfassende sachliche Erschließung mit GND-Schlagwörtern, DDC-Hauptklassen und Abstracts enthält. Erfasst wird auch die betroffene Sprache, was eine Filterung nach Einzelsprachen erlaubt.

Inscriptiones Christianae Graecae (ICG)

Institution(en) Humboldt Universität zu Berlin / Inscriptiones Graecae BBAW
Datendomäne(n) Editionen, Sammlungen, Lexikalische Ressourcen
Sprache(n) Griechisch
Modalität(en) geschrieben
Fächer (DFG) 101 102 104 105 107
Fächer (beschreibend) Religionsgeschichte, Epigraphie, Theologie, Geschichte, historische Kulturwissenschaften, Linguistik

ICG umfasst fast alle christlichen Ehren‑, Votiv‑, Bau- und Grabinschriften aus Kleinasien und Griechenland. Derzeit umfasst die wachsende Datenbank 4297 griechische Inschriften. Jedem Monument ist eineICG-Nummer zugewiesen. Jeder ICG-Eintrag enthält den griechischen Originaltext, eine deutsche oder englische Übersetzung, einen knappen kritischen Apparat und Kommentar, ein oder mehrere Bilder, wenn verfügbar (d. h. ein Foto oder eine Zeichnung, bisher 5812 Abbildungen), sowie alle relevanten Informationen Datierung, Typologie, antike und moderne Provenienz, aktueller Standort und Fundort und den Fundumständen und ist mit Geokoordinaten versehen, die mit digitalen Online-Karten verlinkt sind, nämlich Pleiades, dem iDAI.gazetteer, und GeoNames. Für die archäologischen Belege zum Aufstieg und Verbreitung des Christentums in Attika wurden Kataloge zu den frühchristlichen Kirchen und spätantiken Friedhöfen in Attika fertiggestellt.

ICG bietet einen geographisch strukturierten Zugang zu bisher vernachlässigten lokalisierbaren Primärquellen, indem es Tausende von Inschriften gesammelt hat, die zuvor über Hunderte von Publikationen (seit dem 19. Jahrhundert) verstreut waren. Als erste digitale Datenbank zu christlich-griechischen Inschriften eröffnet sie enorme Möglichkeiten der interdisziplinären Zusammenarbeit zwischen Historikern, die sich für den Aufstieg und die Ausbreitung des Christentums und seinen Fußabdruck von der spätkaiserlichen bis zur frühbyzantinischen Zeit in Kleinasien und Griechenland interessieren, und ist ein nützliches Werkzeug für Forscher aus der Kirchengeschichte, der Alten Geschichte, der Epigraphik, der Archäologie und der Geschichte der Religionen. Die Datenbank kann online über einen ‚Gast‘-Login aufgerufen und nach ICG-Referenznummern, Regionen, antiken und modernen Orten, Bildern, Inschriftentypen oder bibliographischen Einträgen durchsucht und/oder durchgeblättert werden. Darüber hinaus ermöglichen Suchfunktionen die Abfrage der griechischen Originaltexte, der Übersetzungen und der anderen Metadaten unter Verwendung einer Vielzahl von Filtern (z. B. Region, Datierung, Ort, Typ). Da jeder antike und moderne Ort mit Geokoordinaten versehen und mit digitalen Online-Karten verknüpft wurde, ist ICG eine unschätzbare Ressource für die Erforschung der Verbreitung, der sozialen Struktur und des Profils des frühen Christentums und der Entwicklung des Klerus vom 3. bis zum 6. Jahrhundert. Die Datenbank öffnet die Tür, um lokale christliche Gemeinschaften, ihren kulturellen Hintergrund, Geschlechterrollen und Familienbeziehungen, Formen der Führung, den Gebrauch der Schrift, den Aufstieg der Asketen und die Theologie zu studieren und sie mit nicht-christlichen Landsleuten zu vergleichen. Erste Ergebnisse finden sich in den Monographien zu Lykaonien von C. Breytenbach und C. Zimmermann (Leiden: Brill, 2018) und zu Attika von C. Breytenbach und E. Tzavella (Leiden: Brill, [in press]). 

Das ICG bildet derzeit die Grundlage für die Abfassung von 9 Monographien zum Aufstieg des Christentums in Regionen Kleinasiens (Ionien, Untermäander, Phrygien, Galatien), in Griechenland (Korinth und Peloponnes, Attika, Thessalien und Makedonien) und auf dem Balkan. Es ergänzt auch die archäologischen Beweise bei der Erstellung von Monographien über den Aufstieg und die Verbreitung des Christentums. Durch Verweise auf ICG werden die umfangreichen Primärdaten, einschließlich Karten und Bilder, den Lesern der Publikationen online zur Verfügung gestellt. Wenn ICG über Kleinasien und Griechenland hinaus erweitert werden kann, würde es die zukünftige Forschung zum frühen Christentum auf den griechischen Inseln, in Zypern, Syrien und Palästina sowie in Ägypten erheblich erleichtern.