Kategorien
Seiten
-

Forschungsdaten – Aktuelles und Wissenswertes

Nachbericht – Coscine im NFDI ToolTalk

06. April 2023 | von
Coscine im NFDI ToolTalk

Quelle: Eigene Darstellung

Am 20. März 2023 wurde im Rahmen der NFDI ToolTalk-Reihe Coscine vorgestellt. Wie in dem Blogbeitrag NFDI Talks bereits angekündigt, folgt nun der Nachbericht zur digitalen Veranstaltung. Was die Inhalte der Präsentation waren, haben wir für Sie in diesem Beitrag zusammengefasst.

Die NFDI veranstaltet regelmäßige Talks, in denen Experten aus verschiedenen Disziplinen spannende Themen im Forschungsdatenmanagement (FDM) präsentieren. Im aktuellen ToolTalk stand Coscine im Mittelpunkt.

Welche Motivation steckt hinter Coscine?

Coscine bietet zur Nutzung viele gute Gründe. Um die Motivation hinter der Nutzung sowie Entwicklung zu verstehen, müssen zwei Seiten beleuchtet werden. Wenn Nutzende nach ihren Motivatoren für die Nutzung von Coscine gefragt werden, nennen sie oft drei Faktoren:

  • den Bedarf an Speicherplatz (z. B. RDS.NRW),
  • die Notwendigkeit, Finanzierungsanforderungen zu erfüllen
  • und die Verpflichtung, Forschungsdaten für einen Zeitraum von 10 Jahren zu archivieren.

Aus der Perspektive der Universität und der NFDI ist der Hauptgrund für die Entwicklung von Coscine die Erfüllung der Anforderungen an das FDM, insbesondere im Hinblick auf das Management von Metadaten. Beispiele für solche Anforderungen sind die Vorgaben des Hochschulgesetzes NRW zur Gewährleistung der guten wissenschaftlichen Praxis (NRW HG § 3 Abs. 1).

Forschende haben oft Schwierigkeiten, im Umgang mit Forschungsdaten die FAIR-Prinzipien zu berücksichtigen. Meistens werden nur die Daten eines Projekts entsprechend FAIR behandelt, die bei der Veröffentlichung eine Rolle spielen. Dies führt dazu, dass wertvolle (Metadaten-)Informationen verloren gehen. Um Forschenden dabei zu helfen, die FAIR-Prinzipien im Umgang mit Forschungsdaten umzusetzen, haben wir Coscine als Lösung entwickelt. Diese bietet eine Daten-Storage- und Verlinkungs-Umgebung, die für beliebige Datenquellen automatisch die FAIR-Prinzipien implementiert.

Coscine bietet verschiedene Ressourcentypen an. Darunter drei RDS-Varianten wie RDS-Web, RDS-WORM und RDS-S3. Weitere Ressourcentypen sind Linked Data und GitLab, womit extern gespeicherte Forschungsdaten und Codes verknüpft werden können.

Wie funktioniert Coscine genau?

Im ToolTalk wurde neben der Vorstellung von Coscine auch eine Demonstration durchgeführt. Teilnehmende konnten somit Schritt für Schritt durch die Plattform für FDM geführt werden. Sie haben die Demonstration verpasst? Der gesamte Talk wurde aufgezeichnet und kann auf YouTube nachgeschaut werden. Die Coscine-Demonstration startet ab Minute 10:10 und endet bei 23:05.


[Das Video wird nach dem Klick von Youtube geladen und abgespielt, dazu baut der Browser eine direkte Verbindung zu den YouTube-Servern auf. Es gilt die Datenschutzerklärung von Google.]

Einfache Daten säen und FAIRe Daten ernten

Inwiefern die FAIR-Prinzipien mit Coscine eingehalten werden, haben wir bereits in einem Blogbeitrag thematisiert.

Hier die Eckdaten:

  • Mithilfe der Metadaten, des Applikationsprofilgenerator AIMS, der PID und der RDS-Ressourcen können Forschungsdaten auffindbar gemacht werden.
  • Zur Zugänglichkeit der Daten trägt der Login über SSO oder ORCID, die PID und die RDS-Ressourcen bei.
  • Die Interoperabilität wird durch die Metadaten und den Applikationsprofilgenerator AIMS gewährleistet.
  • Wiederverwendbar werden die Forschungsdaten dank des Logins, der Metadaten und der Ressourcentypen.
Symbolbild "FAIRe Daten säen und ernten"

Quelle: Eigene Darstellung

 

FAIR Digital Objects

Welche FDM-Standards werden im Hintergrund verwendet? Durch die Verwendung von FAIR Digital Objects soll eine standardisierte und interoperable Methode zur Beschreibung, Speicherung und ein Austausch von digitalen Objekten geschaffen werden. Diese Methode schafft eine einfachere Nutzung und Wiederverwendung von digitalen Objekten über verschiedene Systeme hinweg. Die semantische Interoperabilität (Semantic Interoperability) ermöglicht die Kommunikation und Interaktion zwischen verschiedenen Systemen durch die Verwendung von gemeinsamen, standardisierten Datentypen des W3C. Dabei wird die Zugriffskontrolle durch die Verwendung von JSON Web Tokens (JWT) ermöglicht. Zur Speicherung und Bereitstellung von Linked Data (RDF) wird das Data Catalog Vocabulary (DCAT) verwendet, das die Hierarchie von Katalogen, Projekten und Ressourcen sowie Datensätzen definiert. Die Entdeckung von verknüpften Daten erfolgt durch die Verwendung der Linked Data Platform (LDP), die eine hierarchische Suche und Exploration ermöglicht. Die Beziehung zwischen Daten und Metadaten wird über den FAIR Data Points definiert. Domänenspezifische Metadaten werden mit SHACL-Anwendungsprofilen validiert, um sicherzustellen, dass sie den festgelegten Standards und Anforderungen entsprechen.

Die Long Term Interoperability (LTI) beschreibt die Fähigkeit von Systemen, auch auf lange Sicht miteinander zu interagieren und zu kommunizieren. Ein wichtiger Bestandteil davon ist die Nutzung von Typed PID Records, die als eindeutige Identifikatoren für digitale Objekte dienen. Eine neue Entwicklung in diesem Bereich ist die Coscine Kernel Information Record, die aktuell definiert wird. Sie umfasst eine kleine Menge an generischen Metadaten und dient dazu, den Zugriff auf das Objekt sowie dessen Eigenschaften zu ermöglichen. Definierte Typen von Zugriffsschnittstellen stellen sicher, dass der Zugriff auf das Objekt und dessen Informationen normiert abläuft. Der Typed PID Record ermöglicht die Verknüpfung mit den dazugehörigen Daten und (umfangreichen) Metadaten. Durch diese Verknüpfungen können die Informationen über das digitale Objekt auch über lange Zeiträume hinweg erhalten und dennoch einfach zugänglich und nutzbar bleiben.

Ein wichtiger Aspekt der Datenverwaltung ist die Interoperabilität mit anderen Werkzeugen und Systemen. Dies wird durch die Entwicklung eines zentralen Metadatenhubs wie beispielsweise dem NFDI4Ing erreicht. Durch die Nutzung von FAIR Digital Objects und dem Metadatenhub können nationale und internationale Datenverwaltungstools wie beispielsweise der NFDI, EOSC und Gaia-X, miteinander vernetzt werden. Dadurch wird verhindert, dass Daten in isolierten Silos gespeichert werden und die Datenwiederverwendung erschwert wird. Der Metadatenhub ermöglicht die standardisierte Beschreibung und Verknüpfung von Datenobjekten sowie deren Metadaten. Dadurch können Daten leichter wiederverwendet und für zukünftige Forschungszwecke zugänglich gemacht werden. Die Interoperabilität und der Datenaustausch zwischen verschiedenen Werkzeugen und Systemen wird somit vereinfacht und verbessert.

Abschluss

Im Nachgang des NFDI ToolTalks konnten viele Fragen der Teilnehmenden geklärt werden. Das Coscine-Team wiederum nahm viel Feedback und weitere Anregungen für die Plattform auf. Für diesen produktiven Austausch möchten wir uns herzlich bei allen Teilnehmenden sowie bei der NFDI bedanken, die den Talk ermöglicht hat.

Wer keine Coscine-Veranstaltung mehr verpassen möchte, kann auf der Webseite alle kommenden sowie vergangenen Events in Erfahrung bringen.

Mehr erfahren

Sie möchten keine News über Coscine mehr verpassen? Dann abonnieren Sie unsere Mailingliste und besuchen Sie uns auf unserer Webseite.

Sie haben Fragen oder Feedback? Dann schreiben Sie eine Nachricht an das IT-ServiceDesk. Wir freuen uns auf Ihre Nachricht!

______

Verantwortlich für die Inhalte dieses Beitrags ist Arlinda Ujkani.

Schreibe einen Kommentar