Wir haben bereits Anfang des Jahres über die Inbetriebnahme des neuen Forschungsdaten-Storage berichtet. In diesem Beitrag werfen wir noch einen genaueren Blick auf die Prozessebene des Speichersystems.
Technische Darstellung des Speichersystems
Die Organisation des Speichers in lokale Speicherpools (Aachen, Köln, Bochum, Dortmund, Duisburg Essen) und den gemeinsamen NRW-Pool (Aachen, Köln und Duisburg Essen) ist dafür substanziell.
Die lokalen Pools basieren wie der NRW-Pool aus jeweils mehreren Systemen, die auch in verschiedenen Gebäuden aufgestellt sind. Die rechtliche Eigentümerschaft der einzelnen IT Systeme liegt dabei immer bei der entsprechenden Hochschule, an der diese auch aufgestellt sind. Mittels der Verteilung der IT Systeme eines Pools über mehrere Gebäude wird eine erhöhte Datensicherheit implementiert.
Die lokalen Pools werden außerdem von der jeweiligen Hochschule des Aufstellungsortes der Systeme verwaltet. Die Gestaltung der dazugehörigen Prozesse rund um die Speichernutzung wird dabei durch die lokalen Anforderungen und Strukturen bestimmt.
Der NRW-Pool hingegen wird gemeinsam bewirtschaftet und dient der längerfristige Aufbewahrung besonders schützenswerter Daten. Durch die größere räumliche Distanz der Aufstellungsorte sind die Daten besonders gut gegen lokale Katastrophenfälle gesichert.
Prozessebene: Angebote für die Forschenden in Aachen
In Aachen wird das Speichersystem zunächst über die FDM-Plattform Coscine nutzbar sein. Diese ermöglicht es sicherzustellen, dass alle Daten mit Metadaten beschrieben sind. Zudem wird der Speicher immer einem Projektkontext zugeordnet.
Des Weiteren bietet Coscine die Möglichkeit, Daten langfristig sicher aufzubewahren. Somit unterstützt die Plattform vollumfänglich die Anforderungen der Guten Wissenschaftlichen Praxis sowie die Standards modernen Forschungsdatenmanagements. Darüber hinaus verfügt Coscine über Programmierschnittstellen (APIs), die es erlauben, das Speichersystem im Rahmen von automatisierten Anwendungen und Prozessen anzusprechen.
Zusätzlich wurde der direkte Zugriff auf den Speicher über das S3-Protokoll realisiert.
Bei der Nutzung direkt über das S3-Protokoll gibt es allerdings keine Unterstützung bei der Strukturierung und Annotation der Daten, so dass diese komplett in der Verantwortung der Nutzenden liegt. Diese müssen deswegen in einem Datenmanagementplan darlegen, wie die Sicherung der Daten gemäß den Standards modernen Forschungsdatenmanagements umgesetzt wird. Weitere Informationen zu den FDS-Ressourcen und wie ihr an diese kommt, haben wir in einem anderen Beitrag bereits für euch beschrieben.
Verantwortlich für die Inhalte dieses Beitrags ist Jana Baur.