Alle Datenmanagement-Maßnahmen haben zum Ziel, Forschende bei der Erzeugung, Nutzung, Analyse, Vernetzung und Kuratierung von Forschungsdaten zu unterstützen und deren Bewahrung und Wiederverwendbarkeit, auch für die maschinelle Verarbeitung, sicherzustellen. Zertifizierte Datenrepositorien der antragstellenden und beteiligten Institutionen und perspektivisch weiterer Partner spielen eine entscheidende Rolle bei der Implementierung der Datenhosting- und Archivierungsdienste von Text+; jede Institution übernimmt dabei die Verantwortung für diejenigen Forschungsdaten, die in besonderem Maße mit ihrem Auftrag und ihrem Fachwissen in Zusammenhang stehen. Forschende werden von Beginn an bei der Erstellung von Datenmanagementplänen, der Wahl passender Repositorien und Lizenzen, in der Auswahl und Nutzung fachspezifischer Werkzeuge und Verfahren (z. B. Annotationsverfahren, Text-Data-Mining) sowie der Anwendung und Weiterentwicklung von Standards und Normdaten für die Repräsentation von Forschungsdaten und ihrer Metadaten zur Herstellung von Interoperabilität unterstützt. Auch die FAIRification von Bestandsdaten gehört zum Portfolio. In jährlichen Community-basierten Review- und Innovations-Zyklen wird das Daten-Portfolio ebenso wie das Angebot an digitalen Methoden und Werkzeugen weiterentwickelt.
Der Umgang mit der Vielfalt und Breite sprach- und textbasierter Daten stellt besondere Anforderungen an das Forschungsdatenmanagement. Diese Vielfalt schließt unterschiedliche Metadatenformate ebenso ein wie unterschiedliche Datenformate und unterschiedliche Grade von Strukturiertheit der Daten. Aufgrund von Urheberrechts- und Datenschutzanforderungen verteilen sich diese heterogenen Forschungsdaten auf viele verschiedene Akteure und müssen zu einem großen Teil an unterschiedlichen geographischen Standorten angeboten werden. Daraus ergibt sich die Notwendigkeit einer ortsverteilten Forschungsdateninfrastruktur, die den FAIR-Prinzipien entspricht und gleichzeitig den rechtlichen Anforderungen genügt und sich dabei an gängigen Standards und Empfehlungen, wie z.B. dem BSI-Grundschutz und der ISO 27001, orientiert. Text+ widmet sich der Orchestrierung bestehender und zukünftiger Aktivitäten, die sich über den gesamten Forschungsdatenlebenszyklus erstrecken.
Die antragstellenden und beteiligten Institutionen verfügen über beträchtliche Erfahrungen beim Aufbau und Betrieb eines ortsverteilten Netzwerkes von zertifizierten Datenzentren. Die Zertifizierung, die eine verbindliche Anforderung für alle an Text+ beteiligten Datenrepositorien darstellen wird, erfolgt nach internationalen Standards des Core Trust Seals. Bei der Umsetzung der FAIR-Prinzipien kann Text+ auf die folgenden bestehenden Komponenten eines Forschungsdatenmanagements zurückgreifen: Einhaltung von Metadatenstandards, Anwendung von standardkonformen Protokollen für das Metadaten-Harvesting, Zuweisung von persistenten Identifikatoren für Forschungsdaten, Anwendung standardkonformer Protokolle zur Authentifizierung, Autorisierung und Identifikation (AAI) sowie für das Harvesting. Die antragstellenden und beteiligten Institutionen von Text+ haben ausgereifte Datenspeicherlösungen entwickelt, die bereits seit einigen Jahren in Betrieb sind und die für die Kuration und Archivierung sprach- und textbasierter Forschungsdaten genutzt werden.