{"id":20686,"date":"2024-11-08T11:00:48","date_gmt":"2024-11-08T10:00:48","guid":{"rendered":"https:\/\/blog.rwth-aachen.de\/itc\/?p=20686"},"modified":"2026-02-10T16:07:19","modified_gmt":"2026-02-10T15:07:19","slug":"coscine","status":"publish","type":"post","link":"https:\/\/blog.rwth-aachen.de\/itc\/2024\/11\/08\/coscine\/","title":{"rendered":"Coscine \u2013 Wie ist die FDM-Plattform eigentlich aufgebaut?"},"content":{"rendered":"<div class=\"twoclick_social_bookmarks_post_20686 social_share_privacy clearfix 1.6.4 locale-de_DE sprite-de_DE\"><\/div><div class=\"twoclick-js\"><script type=\"text\/javascript\">\/* <![CDATA[ *\/\njQuery(document).ready(function($){if($('.twoclick_social_bookmarks_post_20686')){$('.twoclick_social_bookmarks_post_20686').socialSharePrivacy({\"txt_help\":\"Wenn Sie diese Felder durch einen Klick aktivieren, werden Informationen an Facebook, Twitter, Flattr, Xing, t3n, LinkedIn, Pinterest oder Google eventuell ins Ausland \\u00fcbertragen und unter Umst\\u00e4nden auch dort gespeichert. N\\u00e4heres erfahren Sie durch einen Klick auf das <em>i<\\\/em>.\",\"settings_perma\":\"Dauerhaft aktivieren und Daten\\u00fcber-tragung zustimmen:\",\"info_link\":\"http:\\\/\\\/www.heise.de\\\/ct\\\/artikel\\\/2-Klicks-fuer-mehr-Datenschutz-1333879.html\",\"uri\":\"https:\\\/\\\/blog.rwth-aachen.de\\\/itc\\\/2024\\\/11\\\/08\\\/coscine\\\/\",\"post_id\":20686,\"post_title_referrer_track\":\"Coscine+%E2%80%93+Wie+ist+die+FDM-Plattform+eigentlich+aufgebaut%3F\",\"display_infobox\":\"on\"});}});\n\/* ]]> *\/<\/script><\/div><p><div id=\"attachment_20692\" style=\"width: 310px\" class=\"wp-caption alignright\"><a href=\"https:\/\/blog.rwth-aachen.de\/itc\/files\/2024\/11\/Coscine-Logo.png\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-20692\" class=\"size-medium wp-image-20692\" src=\"https:\/\/blog.rwth-aachen.de\/itc\/files\/2024\/11\/Coscine-Logo-300x136.png\" alt=\"Coscine-Logo\" width=\"300\" height=\"136\" srcset=\"https:\/\/blog.rwth-aachen.de\/itc\/files\/2024\/11\/Coscine-Logo-300x136.png 300w, https:\/\/blog.rwth-aachen.de\/itc\/files\/2024\/11\/Coscine-Logo.png 426w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/a><p id=\"caption-attachment-20692\" class=\"wp-caption-text\">Quelle: <a href=\"https:\/\/about.coscine.de\">Coscine<\/a><\/p><\/div><\/p>\n<p>Forschende stehen t\u00e4glich vor der Herausforderung, gro\u00dfe Mengen an Daten effizient zu verwalten und zug\u00e4nglich zu machen. In der heutigen Zeit geht die Verwaltung von Daten \u00fcber das einfache Speichern hinaus. Forschungsdaten sollten gem\u00e4\u00df der <a href=\"https:\/\/forschungsdaten.info\/themen\/veroeffentlichen-und-archivieren\/faire-daten\/\"><strong>FAIR<\/strong>-Prinzipen<\/a> leicht auffindbar (<strong>F<\/strong>indable), zug\u00e4nglich (<strong>A<\/strong>ccessible), interoperabel (<strong>I<\/strong>nteroperable) und wiederverwendbar (<strong>R<\/strong>eusable) sein. Genau hier setzt <a href=\"https:\/\/about.coscine.de\/\">Coscine<\/a> (<strong>Co<\/strong>llaborative <strong>Sc<\/strong>ientific <strong>In<\/strong>tegration <strong>E<\/strong>nvironment) an \u2013 eine Plattform, die Forschende w\u00e4hrend des Datenlebenszyklus unterst\u00fctzt.<\/p>\n<p>Doch was bedeutet das genau? Lasst uns einen Blick auf den Aufbau von Coscine werfen und Schritt f\u00fcr Schritt erkl\u00e4ren, wie die Plattform f\u00fcr Forschungsdatenmanagement (FDM) funktioniert.<\/p>\n<p><!--more--><\/p>\n<p>&nbsp;<\/p>\n<h3><span style=\"color: #00549f;\">Der Aufbau von Coscine<\/span><\/h3>\n<p>Die Grafik von Coscine zeigt, wie die verschiedenen Bausteine miteinander verbunden sind und wie Coscine aufgebaut ist.<\/p>\n<div id=\"attachment_20688\" style=\"width: 1034px\" class=\"wp-caption aligncenter\"><a href=\"https:\/\/blog.rwth-aachen.de\/itc\/files\/2024\/11\/Design-10.png\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-20688\" class=\"wp-image-20688 size-large\" src=\"https:\/\/blog.rwth-aachen.de\/itc\/files\/2024\/11\/Design-10-1024x683.png\" alt=\"Infrastruktur Coscine\" width=\"1024\" height=\"683\" srcset=\"https:\/\/blog.rwth-aachen.de\/itc\/files\/2024\/11\/Design-10-1024x683.png 1024w, https:\/\/blog.rwth-aachen.de\/itc\/files\/2024\/11\/Design-10-300x200.png 300w, https:\/\/blog.rwth-aachen.de\/itc\/files\/2024\/11\/Design-10-768x512.png 768w, https:\/\/blog.rwth-aachen.de\/itc\/files\/2024\/11\/Design-10-1536x1024.png 1536w, https:\/\/blog.rwth-aachen.de\/itc\/files\/2024\/11\/Design-10-2048x1365.png 2048w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/a><p id=\"caption-attachment-20688\" class=\"wp-caption-text\">Quelle: <a href=\"https:\/\/about.coscine.de\">Coscine<\/a><\/p><\/div>\n<p>&nbsp;<\/p>\n<h3><span style=\"color: #00549f;\">1. Login und Zugriff<\/span><\/h3>\n<p>Der erste Schritt, um Coscine zu nutzen, ist der <strong>Login<\/strong>. Hierbei sind verschiedene Methoden zur Anmeldung m\u00f6glich, aktuell zum Beispiel <strong>DFN-AAI<\/strong>, <strong>ORCiD<\/strong> oder <strong>RegApp<\/strong>. Das bedeutet, dass Forschende, egal von welcher Universit\u00e4t oder Forschungseinrichtung, einfach auf die Plattform zugreifen k\u00f6nnen. Es besteht auch die M\u00f6glichkeit, die verschiedenen Anmeldemethoden zu verkn\u00fcpfen. Nach dem Einloggen gelangt man zur <strong>Anwendungsoberfl\u00e4che (UI)<\/strong>. Diese Oberfl\u00e4che ist die &#8222;Startseite&#8220;, von der aus alles gesteuert werden kann. Die UI ist direkt mit der <strong>API<\/strong> (Application Programming Interface) verbunden, die als zentrale Schnittstelle dient.<\/p>\n<p>&nbsp;<\/p>\n<h3><span style=\"color: #00549f;\">2. API: Die Schnittstelle<\/span><\/h3>\n<p>Im Zentrum der Grafik steht die <strong>API<\/strong>. Eine API ist eine Art Br\u00fccke, die verschiedene Programme und Dienste miteinander verbindet. \u00dcber die API kommunizieren die verschiedenen Teile von Coscine miteinander.<\/p>\n<p>Die API ist also der Dreh- und Angelpunkt, \u00fcber den alle anderen Bausteine der Plattform miteinander verkn\u00fcpft sind. Sie stellt sicher, dass die verschiedenen Elemente reibungslos zusammenarbeiten.<\/p>\n<p>&nbsp;<\/p>\n<h3><span style=\"color: #00549f;\">3. Ressourcen<\/span><\/h3>\n<p>Ein wesentlicher Bestandteil von Coscine sind die verschiedenen Ressourcen. Folgende zwei Ressourcen stehen allen Forschenden zur Verf\u00fcgung:<\/p>\n<ul>\n<li><strong>Linked Data<\/strong>: Mit Linked Data ist es m\u00f6glich, Metadaten zu Dateien in externen Systemen, die nicht in Coscine integriert sind, zu verwalten.<\/li>\n<li><strong>GitLab<\/strong>: Mit dem Ressourcentyp GitLab ist es m\u00f6glich, Metadaten zu GitLab Repositorien in\u00a0Coscine\u00a0zu verwalten.<\/li>\n<\/ul>\n<p>Die folgenden drei Ressourcen hingegen stehen berechtigten Hochschulen von DH.NRW zur Verf\u00fcgung:<\/p>\n<ul>\n<li><strong>Web: <\/strong>Web Ressourcen k\u00f6nnen ohne Speicherplatzantrag in jedem Projekt angelegt werden, sodass die Daten \u00fcber den Browser hochgeladen werden k\u00f6nnen. Berechtigte Nutzende erhalten 100 GB und k\u00f6nnen, falls notwendig, den Speicherplatz mithilfe eines Antrags weiter erh\u00f6hen.<\/li>\n<li><strong>S3: <\/strong>Diese Ressource ist besonders f\u00fcr gro\u00dfe Datenmengen geeignet. S3 Ressourcen k\u00f6nnen per S3-Protokoll mit verschiedenen Clients genutzt werden wie z.B. WinSCP, Cyberduck oder MinIO Client.<\/li>\n<li><strong>WORM<\/strong>: WORM steht f\u00fcr Write once, read many. Einmal gespeicherte Daten k\u00f6nnen\u00a0nie wieder\u00a0gel\u00f6scht, ge\u00e4ndert oder \u00fcberschrieben werden. Deshalb ist dieser Ressourcentyp nur f\u00fcr Daten geeignet, die\u00a0zwingend\u00a0einen so hohen Schutzbedarf ben\u00f6tigen.<\/li>\n<\/ul>\n<p>Je nach Ressourcentyp k\u00f6nnen verschiedene Clients (z.B. S3-Clients und Git-Clients) f\u00fcr den direkten Zugriff verwendet werden.<\/p>\n<p>In der SQL-Datenbank (Structured Query Language) werden alle relevanten Daten zur Verwaltung der Nutzenden, Projekte und Ressourcen gespeichert. Dies bildet somit die Grundlage, auf der Coscine basiert.<\/p>\n<p>&nbsp;<\/p>\n<h3><span style=\"color: #00549f;\">4. Schnelle Suche nach Daten<\/span><\/h3>\n<p>Ein wichtiger Bestandteil von Coscine ist die M\u00f6glichkeit, (Meta)-Daten schnell und einfach zu durchsuchen. Hier kommt <strong>ElasticSearch<\/strong> ins Spiel. ElasticSearch ist ein Tool, das riesige Datenmengen schnell durchforstet und relevante Ergebnisse liefert. Zus\u00e4tzlich bietet Coscine eine <strong>semantische Suche.<\/strong> Bei der semantischen Suche werden die Informationen in Kontext zueinander gesetzt und erm\u00f6glichen so eine Suche, die auch verkn\u00fcpfte Elemente findet. Um die semantische Suche zu erm\u00f6glichen, wird \u00fcber das Projekt Semantic Search ein besonderes Dokument f\u00fcr ElasticSearch erstellt. Diese Dokumente werden speziell angefertigt, um eine semantische Suche \u00fcber Coscine zu erm\u00f6glichen.<\/p>\n<p>Die Grafik zeigt verschiedene M\u00f6glichkeiten, mit der API zu interagieren. Die Interaktion ist \u00fcber bereits entwickelte <strong>Clients<\/strong> in <strong>C#<\/strong> oder <strong>TypeScript <\/strong>m\u00f6glich. Nutzende k\u00f6nnen auch ihren eigenen Client \u00fcber die OpenAPI-Definition erstellen. \u00dcber die, aus der API Definition generierten <strong>Swagger-Seite<\/strong> kann die API \u201eexploriert\u201c werden. Au\u00dferdem ist ein weiterer Client in Python implementiert (Coscine Python SDK) und bietet weitere Features und Funktionen zur Nutzung von Coscine.<\/p>\n<p><strong>\u00a0<\/strong><\/p>\n<h3><span style=\"color: #00549f;\">5. FAIR Digital Objects (FDO)<\/span><\/h3>\n<p>Ein weiterer wichtiger Punkt in der Grafik sind die <strong>FAIR Digital Objects (FDO) <\/strong>\u2013 also Daten, die leicht zu finden, zug\u00e4nglich, verkn\u00fcpfbar und wiederverwendbar sind. Jedes FDO enth\u00e4lt wichtige <strong>Metadaten<\/strong> (Informationen \u00fcber die Daten selbst) und einen <strong>Persistent Identifier (PID)<\/strong>, der sicherstellt, dass die Daten auch langfristig verf\u00fcgbar und auffindbar bleiben.<\/p>\n<p>Die Metadaten der FDOs werden im <strong>QuadStore<\/strong> gespeichert, w\u00e4hrend die PIDs bei einem externen, speziell daf\u00fcr angefertigten Service gesichert werden. Bei einem QuadStore handelt es sich um eine spezielle Datenbank, die sich auf verkn\u00fcpfte Daten \u2013 bspw. <strong>RDF<\/strong> (Research Data Format) strukturiert \u00fcber <strong>SHACL<\/strong> (Shapes Constraint Language) \u2013 konzentriert. \u00dcber den <strong>QuadStore<\/strong> k\u00f6nnen die Daten dann in <strong>Linked Data Plattformen<\/strong> integriert und mit <strong>SPARQL-Clients<\/strong> durchsucht werden.<\/p>\n<p>&nbsp;<\/p>\n<h3><span style=\"color: #00549f;\">6. Metadatenprofile<\/span><\/h3>\n<p>Damit die Daten richtig beschrieben und geordnet sind, bietet Coscine den <strong>AIMS Metadatenprofil-Generator<\/strong>. Dieser hilft dabei, Metadatenprofile zu erstellen oder bereits bestehende Profile zu finden, die Daten pr\u00e4zise beschreiben und so die Wiederverwendbarkeit und Suche erleichtern.<\/p>\n<p>&nbsp;<\/p>\n<h3><span style=\"color: #00549f;\">Fazit: Coscine macht Forschung einfacher<\/span><\/h3>\n<p>Coscine erleichtert Forschenden den gesamten Umgang mit ihren Daten \u2013 von der Speicherung \u00fcber die Suche bis hin zur langfristigen Nutzung. Die klare Struktur der Plattform und die zentrale API machen es einfach, auf verschiedene Speicheroptionen zuzugreifen und Daten schnell zu finden. Besonders wertvoll ist die Integration der <strong>FAIR Digital Objects<\/strong>, die daf\u00fcr sorgen, dass Daten nicht nur heute, sondern auch in Zukunft auffindbar, zug\u00e4nglich und wiederverwendbar sind.<\/p>\n<p>Coscine bietet eine flexible, moderne L\u00f6sung f\u00fcr die Anforderungen der Forschung. Egal, ob ihr eine kleine Datenmenge speichern oder riesige Datenbest\u00e4nde durchsuchen m\u00fcsst \u2013 Coscine hat die passenden Werkzeuge, um eure Arbeit effizienter und nachhaltiger zu gestalten. Es ist nicht nur ein Werkzeug f\u00fcr den Moment, sondern eine Plattform, die auch zuk\u00fcnftigen Herausforderungen gewachsen ist.<\/p>\n<p>&nbsp;<\/p>\n<hr \/>\n<p>Verantwortlich f\u00fcr die Inhalte dieses Beitrags sind <a href=\"https:\/\/www.itc.rwth-aachen.de\/cms\/it-center\/it-center\/profil\/team\/~epvp\/mitarbeiter-campus-\/?gguid=PER-PMY9DEQ&amp;allou=1\">Laurin Ellenbeck<\/a> und <a href=\"https:\/\/www.itc.rwth-aachen.de\/go\/id\/epvp\/gguid\/PER-N6AW3XB\/allou\/1\/\">Arlinda Ujkani<\/a>.<\/p>","protected":false},"excerpt":{"rendered":"<p>Forschende stehen t\u00e4glich vor der Herausforderung, gro\u00dfe Mengen an Daten effizient zu verwalten und zug\u00e4nglich zu machen. In der heutigen Zeit geht die Verwaltung von Daten \u00fcber das einfache Speichern [&hellip;]<\/p>\n","protected":false},"author":6019,"featured_media":20692,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"c2c_always_allow_admin_comments":false,"footnotes":""},"categories":[1574,315],"tags":[1305,483,1293,1292,46,1296,1195,44,1283,1291,94,1286,1178,40,1287,470,34,266,245,1288,1280,1279,1284,1297,1298,1074,1303,1299,267,694,1282,1281,1300,269,76,1301,1302,1304,1295,1294,1285,1289,1290],"class_list":["post-20686","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-fdm","category-services-support","tag-aims","tag-api","tag-c","tag-clients","tag-coscine","tag-coscine-python-sdk","tag-data","tag-daten","tag-dfn-aai","tag-elasticsearch","tag-fair","tag-fair-digital-objects","tag-fair-prinzipien","tag-fdm","tag-fdo","tag-forschung","tag-forschungsdaten","tag-forschungsdatenmanagement","tag-gitlab","tag-linked-data","tag-metadata","tag-metadaten","tag-orcid","tag-persistent-identifier","tag-pid","tag-python","tag-quadstore","tag-rdf","tag-rdm","tag-regapp","tag-research","tag-research-data","tag-research-data-format","tag-research-data-management","tag-s3","tag-shacl","tag-shapes-constraint-language","tag-sparql-clients","tag-swagger-seite","tag-typescript","tag-ui","tag-web","tag-worm"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/blog.rwth-aachen.de\/itc\/wp-json\/wp\/v2\/posts\/20686","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.rwth-aachen.de\/itc\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.rwth-aachen.de\/itc\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.rwth-aachen.de\/itc\/wp-json\/wp\/v2\/users\/6019"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.rwth-aachen.de\/itc\/wp-json\/wp\/v2\/comments?post=20686"}],"version-history":[{"count":11,"href":"https:\/\/blog.rwth-aachen.de\/itc\/wp-json\/wp\/v2\/posts\/20686\/revisions"}],"predecessor-version":[{"id":21793,"href":"https:\/\/blog.rwth-aachen.de\/itc\/wp-json\/wp\/v2\/posts\/20686\/revisions\/21793"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/blog.rwth-aachen.de\/itc\/wp-json\/wp\/v2\/media\/20692"}],"wp:attachment":[{"href":"https:\/\/blog.rwth-aachen.de\/itc\/wp-json\/wp\/v2\/media?parent=20686"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.rwth-aachen.de\/itc\/wp-json\/wp\/v2\/categories?post=20686"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.rwth-aachen.de\/itc\/wp-json\/wp\/v2\/tags?post=20686"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}