User Stories

Wir haben für Text+ erfolgreich einen überarbeiteten Förderantrag in der zweiten NFDI-Runde eingereicht. Damit setzen wir unser Engagement für den Aufbau einer auf Text- und Sprachdaten ausgerichteten Forschungsdateninfrastruktur fort. Zur Integration des Nutzendenbedarfs haben wir Forschende eingeladen, sich mit User Stories aus ihrem Forschungsumfeld zu beteiligen. Ziel ist es, eine große Bandbreite der beteiligten Disziplinen, Datendomänen und Forschungsfragen zu erfassen.

In kurzer Zeit haben uns mehr als 120 User Stories erreicht, von denen wir mit Zustimmung der  Autorinnen und Autoren 115 hier veröffentlichen konnten. Vielen Dank an die aktive Community für die wertvollen Beiträge und die Bereitschaft, Text+ zu unterstützen! Ihre Rückmeldungen sind wichtig, um das Angebot von Text+ gemeinsam zu gestalten. Generell sehen wir diese Beiträge als ein wichtiges Element der Partizipation an Text+.

Veröffentlichung

Nach und nach haben wir hier die User Stories in einheitlicher und referenzierbarer Form veröffentlicht. Alle Beiträge sind entlang der Datendomänen von Text+ eingeteilt: Collections, Lexical Resources, Editions ergänzt durch eine vierte thematisch übergreifende Kategorie. Als weiteres Ordnungsmerkmal verwenden wir die DFG-Fachsystematik (auf der Ebene 101–113, die Subdisziplinen werden aus den Texten selbst ersichtlich).

Der Gesamtbericht wurde im September 2021 veröffentlicht und ist unter folgendem Link abrufbar: https://doi.org/10.5281/zenodo.5384085

Die Daten für die Analyse wurden im DARIAH-DE Repository veröffentlicht: http://dx.doi.org/10.20375/0000-000E-67ED-4

Die User Stories wurden auf Grundlage dieser Vorlage eingereicht.

Für folgende Calls werden wir aus den gemachten Erfahrungen die Vorlage ggf. modifizieren.
Hier finden Sie die User Stories entsprechend der DFG Fachsystematik sortiert.
Hier finden Sie die User Stories nach Text+ Datendomänen sortiert.

Auswertung

Die Beiträge haben insgesamt einen Schwerpunkt in den Sprach- und Literaturwissenschaften (104–105) und nur wenige beziehen sich ausschließlich auf Geschichte (102) oder Kunst, Musik, Theater, Medien (103). Überraschend stark engagiert haben sich die Klassische Philologie (101) und die Sozial- und Kulturanthropologie / außereuropäische Kulturen, Judaistik und Religionswissenschaften (106) sowie Theologie (107) und Philosophie (108). Auch sozialwissenschaftliche Fächer haben sich zu einem kleinen Teil an unserem Call beteiligt. Daneben weisen einige User Stories einen dezidiert interdisziplinären Fokus auf. Viele User Stories nehmen detailliert Bezug auf infrastrukturelle Fragen oder mögliche Dienste von Text+ und zeigen anhand individueller Forschungsfragen sehr konkret, welche Bedarfe, aber auch Lösungsvorschläge sie einbringen.

Es zeichnet sich ab, dass je nach Kontext, ob Einzelprojekt, größere Forschergruppe oder AG die Einschätzungen über das, was Text+ und die NFDI leisten können und sollen, divergieren. Als roter Faden zieht sich die Beschäftigung mit der Verfügbarkeit und Nutzbarmachung beschränkt zugänglicher Forschungsdaten durch viele User Stories. Ein weiteres wichtiges Thema zielt auf die Möglichkeit ab, wertvolle, aber vielleicht weniger prominente Daten aus kleinen Sprachen oder individuellen Forschungsprojekten mithilfe von Text+ nachnutzbar zu machen. Auch die scheinbar schlichte Verknüpfung verteilter Ressourcen ist ein Anliegen, das weiterhin präsent und für die Community noch nicht gelöst ist.

Die User Stories wurden von einem Team des Text+-Konsortiums gelesen. Insgesamt haben wir 118 aus der Community eingereichte User Stories analysiert und mit Schlagwörtern versehen. Die meisten Stories sind mit mehreren der insgesamt 67 verschiedenen Begriffe verschlagwortet, einige mit einem einzigen, andere mit bis zu 13. Im Durchschnitt wurden sechs Schlagwörter pro User Story vergeben. Insgesamt wurden 773 Begriffe auf alle User Stories verteilt.

Die Schlagwörter fassen mehrere Aspekte zusammen, die im Kontext der NFDI und für die Anforderungen an Text+ wichtig sind. Beispiele für die Auswahl der Schlagwörter sind: Ob Daten selbst produziert oder benötigt werden (data producer, interest in further data), welches Datenformat, die Mehrsprachigkeit der Daten, die FAIR-Prinzipien, möglicher Bedarf an Interaktion zwischen mehreren Ressourcen sowie die  Art der Ressourcen (corpus-corpus, lexical resource-corpora linking) etc.

Die Visualisierungen sind auf Grundlage aller 118 analysierten User Stories entstanden. Sie zeigen in Form von Balkendiagrammen für die häufigsten 20 Schlagwörter den prozentualen Anteil. Die erste Visualisierung zeigt die Anzahl der Schlagwörter auf alle User Stories verteilt. Die folgenden Grafiken zeigen die Verteilung der Schlagwörter und User Stories zu jeder Datendomäne (Sammlungen, Lexikalische Ressourcen und Editionen) sowie für den Bereich Infrastructure/Operations. Zu den Ergebnissen wird eine kurze Erläuterung gegeben.

Text+ User Stories