Kategorien
Seiten
-

Forschungsdaten – Aktuelles und Wissenswertes

Vom Dateninventar zum Datenmanagementplan

04. Januar 2024 | von
Datenmanagementplan

Quelle: Freepik

Hinweis: Der  Blogbeitrag wurde von Katharina M. E. Grünwald verfasst und hat daher einen persönlichen Ton. Sie arbeitet als Data Steward am IT Center der RWTH. Viel Spaß beim Lesen!

Du stehst kurz vor dem Beginn deiner Doktorarbeit, das Thema steht fest und du weißt, wann es losgeht. Doch plötzlich hörst du davon, dass du auch ein gutes Forschungsdatenmanagement (FDM) vorweisen musst, wenn du der modernen guten wissenschaftlichen Praxis gerecht werden möchtest. Dein Fachbereich hat besondere Datenformate, du sollst einen Datenmanagementplan (DMP) ausfüllen, die RWTH bietet Services wie Coscine an und die Deutsche Forschungsgemeinschaft (DFG) hat ebenfalls Vorgaben, was sie sich unter einem guten FDM vorstellt. Ein ganz schönes Chaos… und nun?

Keine Sorge – we got you. In diesem Blogbeitrag erfährst du in zwei leicht anwendbaren Schritten wie du einen Überblick über das Chaos bekommst und die Struktur dahinter verstehst.

Es lohnt sich hier zu Beginn deines Projekts Zeit in das FDM zu investieren, da du langfristig davon profitieren wirst: Die Sauberkeit deines FDMs wird deine Arbeit erleichtern und deine FAIR publizierten Daten werden von der Forschungsgemeinschaft anerkannt.

 

Schritt 1: Das Dateninventar

Bestandsaufnahme: Setz dich hin, nimm dir Zeit und fang an zu brainstormen! Schreibe alles auf, was dir bezüglich des groben Überthemas „Daten“ einfällt: Das können gängige Formate in deiner Forschung sein, Gerätetypen, die diese erzeugen, Speicherorte, an denen ihr eure Daten ablegt, Dateigrößen, Zuständigkeiten und Verantwortlichkeiten für die jeweiligen Daten und so weiter und so fort. Wenn dir nichts mehr einfällt, ist es auch sinnvoll deine Kolleginnen und Kollegen zu fragen, die schon länger dabei sind und vielleicht datenbezogene Dinge kennen, die dir bisher unbekannt waren. Mache das so lange, bis du merkst, dass sich die genannten Komponenten wiederholen und es scheint, als hättest du die Informationen umfänglich notiert. Damit ist die Bestandsaufnahme abgeschlossen.

Datenkarte: Als nächstes erstellst du aus der Bestandsaufnahme eine Mindmap. Diese wird von nun an als „Datenkarte“ bezeichnet, um ihre Funktion eindeutig zu benennen. Sie funktioniert wie eine Landkarte , die dir dabei hilft, dich auf dem Campusgelände zurechtzufinden und zu wissen, wo dein Labor ist und wo du die Bibliothek findest. Die Datenkarte ist das digitale Äquivalent dazu: Sie hilft dir dabei, der abstrakten Datenlandschaft eine Form zu geben und mit einem Blick alle relevanten Komponenten und Speicherorte für dein Projekt vor dir zu haben. Gehe dabei wie folgt vor:

  • In der Mitte der Datenkarte stehst du, bzw. deine Forschungsgruppe. Hier ist es sinnvoll abzuwägen, ob die Karte nur für dich oder ob auch für deine Gruppe nützlich sein soll.
  • Um die Mitte herum befinden sich die Oberkategorien, in die nun die Inhalte des Brainstormings sortiert eingetragen werden. Sinnvolle Oberkategorien können sein:
    • Speicherorte
    • Archive
    • Repositorien für geplante Datenpublikationen
    • Dateiformate
    • Analyseprogramme / Tools
    • Pipelines
    • Verantwortlichkeiten
    • (Programmier-)sprachen
    • Metadatenstandards
  • Zwischen einzelnen Komponenten der Datenkarte können Verbindungslinien gezogen werden, um ihren Zusammenhang zu veranschaulichen.
  • Mein Tipp: Um die Datenkarte digital zu erstellen, verwende das Open-Source-Tool excalidraw.
  • Die beiden Abbildungen zeigen ein Template und eine anonymisierte echte Datenkarte. Du kannst die Abbildungen abspeichern und per Drag and Drop auf die leere Leinwand in Excalidraw ziehen, um mit ihnen zu arbeiten.
  • Ein weiterer Nutzen der Datenkarte kann sein, dass deine Forschungsgruppe in ihr auch leicht Schwachstellen in der gegebenen Dateninfrastruktur eintragen kann. Vielleicht habt ihr ein Sicherheitsrisiko oder benutzt zu viele verschiedene Speicherorte, vielleicht ist die standardisierte und somit FAIRe Datenbezeichnung noch nicht verpflichtend. Diese Schwachstellen könnt ihr, wie in dem Beispiel der realen Datenkarte, rot markieren und sie im Laufe der Zeit beseitigen.

 

Mind Map Beispiel

Beispiel Datenkarte
Quelle: Eigene Darstellung

Datenkarte Template

Template Datenkarte
Quelle: Eigene Darstellung

 

 

 

 

 

 

 

 

 

 

 

 

Schritt 2: Der Datenmanagementplan

Möglicherweise hast du bereits von einem DMP gehört. Ein DMP strukturiert die Handhabung von Forschungsdaten in einem wissenschaftlichen Projekt und das in Textform. Er beschreibt, wie die Daten während der Laufzeit des Projekts und nach Abschluss des Projekts verwaltet werden. Auch werden hier Entscheidungen zum Datenmanagement mit Begründung festgehalten und der DMP sollte im Laufe des Projektes aktualisiert und an die gelebte Realität angepasst werden.

Auf der Grundlage deines Wissens aus der zuvor erstellten Datenkarte kannst du die Inhalte eines DMP leicht ableiten. Die Inhalte setzen sich aus den Anforderungen der DFG, deiner eigenen Institution und des eigenen Fachbereichs sowie aus dem Datenlebenszyklus zusammen und dokumentieren die eigenen Planungen und Entscheidungen.

Viele Fördermittelgeber, wie die Deutsche Forschungsgemeinschaft (DFG), der Wissenschaftsfond (FWF), der Schweizerische Nationalfonds (SNF), Horizon Europe und die Volkswagen Stiftung erwarten Informationen zum Forschungsdatenmanagement als Teil eines Förderantrags. Wenn du bereits einen DMP verfasst hast, kannst du leicht Textbausteine aus diesem herausnehmen und sie modular für den jeweiligen Antrag so zusammensetzen, wie es erwartet wird.

An der RWTH wird allen Forschenden die Anwendung Research Data Management Organiser (RDMO) zur Verfügung gestellt. In der Erstellung des DMPs findest du eine Reihe an bereits zur Nutzung freigegebenen DMP-Vorlagen, aus denen du auswählen kannst. Meine Empfehlung ist die im Juni 2023 veröffentlichte Vorlage „generic: DFG checklist (RWTH template)“. Sie enthält die DFG-Anforderungen und ist mit den spezifischen RWTH-Anforderungen ergänzt. Dadurch wird es dir abgenommen, alle Bestimmungen selbst zusammensuchen zu müssen. Allerdings ist die Vorlage generisch, d. h., die spezifischen Anforderungen deines Fachbereichs sind nicht hinterlegt.

Um dir einen ersten Eindruck von den zu beantwortenden Fragen in dieser Vorlage zu geben, findest du hier einen kleinen Überblick:

  • Welche Arten von Daten werden produziert?
  • Welche Daten- und Metadatenstandards werden implementiert?
  • Wer hat Zugang zu den Daten?
  • Unter welchen Bedingungen können die Daten wiederverwendet werden?
  • Wie können die Daten archiviert werden?

Durch die beiden Schritte – die Erstellung des Dateninventars und die anschließende Übertragung des Wissens in die Textform des DMPs – erhältst du einen guten Überblick über die Forschungsdatenlage und -infrastruktur für dein Projekt.

Viel Erfolg.

Bei weiterführenden Fragen melde dich immer gerne beim zentralen FDM-Team der RWTH.


Verantwortlich für die Inhalte dieses Beitrags ist Katharina Grünwald.

Schreibe einen Kommentar