Kategorien
Seiten
-

Forschungsdaten – Aktuelles und Wissenswertes

Tag der Forschungsdaten 2022 – Nachbericht zu Coscine – FAIR im Datenmeer

01. Dezember 2022 | von
Auf dem Bild ist ein Meer zu sehen, das ein Datenmeer darstellen soll, passend zur Veranstaltung "Coscine –FAIR im Datenmeer".

Veranstaltung Coscine – FAIR im Datenmeer
Quelle: Eigene Darstellung

Weiter geht es mit dem Nachbericht zum Nachmittagsprogramm des Tags der Forschungsdaten 2022 am Standort der RWTH Aachen University. Wie im letzten Jahr durften auch dieses Mal Forschende aus ganz NRW in den Workshop zu Coscine hineinschnuppern und ihre Fragen zur Plattform für Forschungsdatenmanagement stellen. Was die Inhalte des einstündigen Workshops waren, haben wir für Sie in diesem Beitrag zusammengefasst. Die Folien zum Workshop können Sie auf Zenodo herunterladen.

Begrüßung

Ziel des Workshops war es, die Plattform und ihre Funktionen sowie die Nutzungsmöglichkeiten für Forschende, Data Stewards und FDM-Interessierte vorzustellen. Eine besondere Widmung galt den FAIR-Prinzipien sowie der guten wissenschaftlichen Praxis, die mithilfe von Coscine eingehalten werden können. Außerdem konnte Raum für Fragen und Austausch geschaffen werden.

Zu Beginn des Workshops hieß die IT-Servicemanagerin von Coscine Dr. Ilona Lang die rund 70 Teilnehmenden willkommen und bedankte sich für das rege Interesse an der Plattform. Schließlich wurde mit der Präsentation über Coscine fortgefahren.

Was tut Coscine für die FAIR-Prinzipien?

Der FAIRe Umgang mit Forschungsdaten ist in der Forschung nicht unbedingt selbstverständlich. Wenn überhaupt wird nur ein kleiner Teil der Forschungsdaten eines Projekts bei Veröffentlichung nach den FAIR-Prinzipien behandelt. Dabei geht eine erhebliche Menge an wertvollen (Metadaten-)Informationen verloren. Unsere Lösung hierbei lautet Coscine: Eine Datenspeicherumgebung, die implizit die FAIR-Prinzipien umsetzt.

Wo lässt sich Coscine im Forschungsdatenlebenszyklus einordnen?

Coscine im Forschungsdatenlebenszyklus

Coscine im Forschungsdatenlebenszyklus
Quelle: Eigene Darstellung

Im Forschungsdatenlebenszyklus kann Coscine in jede Phase eingeordnet werden.

Plan: Projekt-Metadaten planen & Projektteam einladen
Production: Hochladen von Metadaten und Daten (automatisch)
Analysis: Projektdaten herunterladen (automatisch)
Preservation: Daten und Metadaten archivieren
Access: PID(s) teilen & Externe zum Projekt einladen
Re-Use: Daten über die interne Metadaten-Suchfunktion finden

Coscine bietet mit seiner Projektstruktur eine einfache Forschungsdatenverwaltung und Zugriff auf freien Speicherplatz. Dabei ist Coscine nicht die Festplatte selbst, auf der die Daten gespeichert werden, sondern ermöglicht den Zugriff auf verschiedene Speicherplätze wie dem Research Data Storage (RDS) und Linked Data. In Zukunft sollen außerdem weitere Ressourcen wie Sciebo, Nextcloud und GitLab hinzukommen.

Die Zusammenarbeit in einem Forschungsprojekt kann mithilfe von Coscine deutlich vereinfacht werden, da alle Projektmitglieder Zugriff auf die Daten haben. Metadaten werden dank Coscine automatisch mit Daten verknüpft, egal wo sie liegen. Ferner lassen sich mit der Integration des Applikationsprofilgenerators von AIMS (Applying Interoperable Metadata Standards) individuelle, projektspezifische Anwendungsprofile erstellen. Zum Schluss können die Daten zehn Jahre nach Projektende auf dem RDS archiviert werden.

Coscine – Live Demo

Nachdem die Fragen der Teilnehmenden zur Archivierung geklärt wurden, führte Dr. Ilona Lang die ersten Schritte live auf der Plattform vor. Sie zeigte die verschiedenen Login-Varianten (Login via SSO und ORCID) sowie das Ausfüllen der persönlichen Daten im Nutzerprofil. Die persönlichen Daten sind, im Falle eines Logins via SSO, bereits automatisch eingepflegt. Wenn man sich allerdings über die ORICID einloggt, müssen diese Daten selbst nachgepflegt werden. Im Anschluss an das Nutzerprofil wurden die Projektebene in Coscine vorgestellt.  In den Projekteinstellungen ist die erste verpflichtende Ebene der Metadaten fortgefahren. In der Benutzerverwaltung besteht die Möglichkeit, Personen zu suchen und Mitglieder einzuladen.

Im nächsten Schritt ging es dann um die Quotaverwaltung. Hier können unterschiedliche Ressourcen hinzugefügt werden. Dr. Ilona Lang stellte dies zunächst am Beispiel einer Web-Ressource vor. Im ersten Schritt wird ein Ressourcentyp ausgewählt. Im zweiten Schritt werden die generischen Metadaten der Ressource (Titel, Disziplin etc.) angegeben. In Schritt 3 wird ein Applikationsprofil ausgewählt, welches die Metadaten für die Forschungsdaten festlegt. Sollte dabei kein vorhandenes Profil passen, kann über den Applikationsprofilgenerator ein eigenes Profil erstellt und gespeichert werden. Der vierte Schritt bietet eine Übersicht über alle Informationen. Daraufhin kann die Ressource angelegt und Dateien hinzugefügt werden.

Ein weiteres Beispiel folgte mit der Demonstration der S3-Ressource. Hierbei werden die S3 Credentials direkt zur Verfügung gestellt. Speicherplatz auf diesem Ressourcentyp muss daher durch einen Quota-Antrag beantragt werden.

Eine detaillierte Anleitung finden Sie in der Coscine-Dokumentation.

Fazit – Was macht Coscine also FAIR?

Mithilfe des Logins über SSO und ORCID werden institutionelle Grenzen gebrochen und somit Forschungsdaten zugänglich und wiederverwendbar gemacht.

Metadaten werden auf Projekt- und Ressourcenebene erfasst und automatisch mit Forschungsdaten verknüpft und können innerhalb von Coscine öffentlich zugänglich gemacht werden. Außerdem sind sie über ElasticSearch durchsuchbar. Die technische Darstellung und Validierung geschieht über die W3C-Standards RDF und SHACL. Zusätzlich ist die Anbindung an den NFDI4Ing Metadaten-Hub über „FAIR Digital Object“ Schnittstellen geplant. All diese Aspekte tragen dazu bei, dass die Forschungsdaten auffindbar und interoperabel sind.

Der Applikationsprofilgenerator AIMS ermöglicht die Erstellung von Profilen mit individuellen und disziplinspezifischen Metadaten, wodurch keine technischen Kenntnisse erforderlich sind (RDF und SHACL). Dies macht Forschungsdaten auffindbar und interoperabel.

Durch verschiedenen Ressourcentypen wird die Speicherung von Forschungsdaten möglich gemacht. Unter anderem besteht Zugriff auf das konsortiale Objektspeichersystem RDS (Web, S3, WORM). Dort wird ein Aufbewahrungs- und Archivierungszeitraum von zehn Jahren garantiert. Mithilfe von Linked Data können extern gespeicherte Forschungsdaten verknüpft werden. Daraus resultiert, dass die Forschungsdaten wiederverwendbar sind.

Mittels Handle-basierter ePIC Persistent Identifier werden die Speicherorte der Forschungsdaten eindeutig und dauerhaft identifizierbar sowie auf globaler Ebene referenzierbar. Des Weiteren werden Fragment-Identifikatoren für einzelne Dateien durch erweiterte Handle-URL ermöglicht. Dies macht die Forschungsdaten auffindbar.

Bei RDS-Ressourcen ist abhängig vom Ressourcentyp eine Interaktion über Browser, S3-Protokoll oder REST-API möglich. Durch die REST-Schnittstelle sind Daten und Metadaten unabhängig voneinander auffindbar und zugänglich. Durch die einfache Eingabe von Daten und Metadaten in das System wird die spätere Nutzung erleichtert. Außerdem ermöglicht die Schnittstelle Arbeitsabläufe zu automatisieren. Somit werden die Forschungsdaten auffindbar und zugänglich gemacht.

Abschluss

Die rege Teilnahme an dem Workshop sowie die wichtigen Fragen, die darin gestellt wurden, ermöglichten eine interessante Diskussion und viele Einblicke in die Funktionen von Coscine. Insbesondere Personen, die Coscine noch nicht nutzen, konnten hier die Chance ergreifen, live durch die Plattform geführt zu werden und hineinschnuppern zu können.

Wir bedanken uns bei allen Teilnehmenden für das Interesse an Coscine und den daraus entstandenen erfolgreichen Austausch miteinander.

Mehr erfahren

Sie möchten keine News über Coscine mehr verpassen? Dann abonnieren Sie unsere Mailingliste und besuchen Sie uns auf unserer Webseite.

Sie haben Fragen oder Feedback? Dann schreiben Sie eine Nachricht an das IT-ServiceDesk. Wir freuen uns auf Ihre Nachricht!

______

Verantwortlich für die Inhalte dieses Beitrags ist Arlinda Ujkani.

Schreibe einen Kommentar