{"id":1680,"date":"2017-11-03T13:00:12","date_gmt":"2017-11-03T11:00:12","guid":{"rendered":"https:\/\/blog.rwth-aachen.de\/itc\/?p=1680"},"modified":"2023-10-13T11:00:33","modified_gmt":"2023-10-13T09:00:33","slug":"rosetta-eine-kooperation-des-hochschulbibliothekszentrums-nrw-und-der-rwth-aachen","status":"publish","type":"post","link":"https:\/\/blog.rwth-aachen.de\/itc\/en\/2017\/11\/03\/rosetta-eine-kooperation-des-hochschulbibliothekszentrums-nrw-und-der-rwth-aachen\/","title":{"rendered":"Rosetta &#8211; eine Kooperation des Hochschulbibliothekszentrums NRW und der RWTH Aachen"},"content":{"rendered":"<div class=\"twoclick_social_bookmarks_post_1680 social_share_privacy clearfix 1.6.4 locale-en_US sprite-en_US\"><\/div><div class=\"twoclick-js\"><script type=\"text\/javascript\">\/* <![CDATA[ *\/\njQuery(document).ready(function($){if($('.twoclick_social_bookmarks_post_1680')){$('.twoclick_social_bookmarks_post_1680').socialSharePrivacy({\"txt_help\":\"Wenn Sie diese Felder durch einen Klick aktivieren, werden Informationen an Facebook, Twitter, Flattr, Xing, t3n, LinkedIn, Pinterest oder Google eventuell ins Ausland \\u00fcbertragen und unter Umst\\u00e4nden auch dort gespeichert. N\\u00e4heres erfahren Sie durch einen Klick auf das <em>i<\\\/em>.\",\"settings_perma\":\"Dauerhaft aktivieren und Daten\\u00fcber-tragung zustimmen:\",\"info_link\":\"http:\\\/\\\/www.heise.de\\\/ct\\\/artikel\\\/2-Klicks-fuer-mehr-Datenschutz-1333879.html\",\"uri\":\"https:\\\/\\\/blog.rwth-aachen.de\\\/itc\\\/en\\\/2017\\\/11\\\/03\\\/rosetta-eine-kooperation-des-hochschulbibliothekszentrums-nrw-und-der-rwth-aachen\\\/\",\"post_id\":1680,\"post_title_referrer_track\":\"Rosetta+%26%238211%3B+eine+Kooperation+des+Hochschulbibliothekszentrums+NRW+und+der+RWTH+Aachen\",\"display_infobox\":\"on\"});}});\n\/* ]]> *\/<\/script><\/div><div id=\"attachment_17518\" style=\"width: 310px\" class=\"wp-caption alignleft\"><a href=\"https:\/\/blog.rwth-aachen.de\/itc\/files\/2017\/11\/inaki-del-olmo-NIJuEQw0RKg-unsplash.jpg\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-17518\" class=\"wp-image-17518 size-medium\" src=\"https:\/\/blog.rwth-aachen.de\/itc\/files\/2017\/11\/inaki-del-olmo-NIJuEQw0RKg-unsplash-300x200.jpg\" alt=\"\" width=\"300\" height=\"200\" srcset=\"https:\/\/blog.rwth-aachen.de\/itc\/files\/2017\/11\/inaki-del-olmo-NIJuEQw0RKg-unsplash-300x200.jpg 300w, https:\/\/blog.rwth-aachen.de\/itc\/files\/2017\/11\/inaki-del-olmo-NIJuEQw0RKg-unsplash-1024x683.jpg 1024w, https:\/\/blog.rwth-aachen.de\/itc\/files\/2017\/11\/inaki-del-olmo-NIJuEQw0RKg-unsplash-768x512.jpg 768w, https:\/\/blog.rwth-aachen.de\/itc\/files\/2017\/11\/inaki-del-olmo-NIJuEQw0RKg-unsplash-1536x1024.jpg 1536w, https:\/\/blog.rwth-aachen.de\/itc\/files\/2017\/11\/inaki-del-olmo-NIJuEQw0RKg-unsplash.jpg 1920w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/a><p id=\"caption-attachment-17518\" class=\"wp-caption-text\">Quelle: <a href=\"https:\/\/unsplash.com\/de\/fotos\/NIJuEQw0RKg\">Unsplash<\/a><\/p><\/div>\n<h4>Die Software<\/h4>\n<p>Rosetta ist eine Software der Firma ExLibris f\u00fcr die Langzeitarchivierung von Daten. Das bedeutet vor allem, dass sie neben den Standardfunktionen eines Archiv-Systems (\u201e<a href=\"http:\/\/www.forschungsdaten.org\/index.php\/Bitstream_Preservation\">bitstream-preservation<\/a>\u201c, regelm\u00e4\u00dfige Integrit\u00e4tstests, Reduplizierung, \u2026) eine Format-Validierung bietet. Beim Ingest der Daten wird das Dateiformat genau bestimmt und dokumentiert. Dieses wird dann regelm\u00e4\u00dfig gegen eine zentral gepflegte Datenbank gepr\u00fcft, die an die <a href=\"http:\/\/www.nationalarchives.gov.uk\/PRONOM\/Default.aspx\">PRONOM<\/a>-Datenbank angelehnt ist und Informationen \u00fcber die G\u00fcltigkeit eines Formats enth\u00e4lt. Bei Bedarf k\u00f6nnen fehlende Formate auch lokal in Rosetta erg\u00e4nzt werden. Wird bekannt oder absehbar, dass ein Dateiformat nicht mehr lesbar ist, warnt Rosetta den Besitzer\/die Besitzerin der fraglichen Daten, der\/die dann die Transformation in ein anderes Format ansto\u00dfen kann.<\/p>\n<h4>Das Projekt<\/h4>\n<p>Das <a href=\"https:\/\/www.hbz-nrw.de\/produkte\/langzeitverfuegbarkeit\/langzeitverfuegbarkeit-fuer-hochschulen\">Hochschulbibliothekszentrum NRW (hbz)<\/a> mit Sitz in K\u00f6ln ist ein zentraler Dienstleister f\u00fcr die Universit\u00e4tsbibliotheken des Landes. Das hbz hat die Software Rosetta f\u00fcr Nordrhein-Westfalen lizensiert und betreibt eine zentrale Instanz.<\/p>\n<p>In der Pilotphase gibt es drei Partner, mit denen unterschiedliche Use Cases getestet werden. W\u00e4hrend der Fall der Universit\u00e4ts- und Stadtbibliothek K\u00f6ln (USB) den \u201eklassischen\u201c Anwendungsfall darstellt, soll in den Use Cases der Universit\u00e4ten K\u00f6ln und Aachen die Eignung des Systems f\u00fcr Forschungsdaten getestet werden.<\/p>\n<h4>Der Aachener Use Case<\/h4>\n<p>Im Aachener Use Case geht es um die Archivierung von gro\u00dfen Daten aus Simulationen zu kleinskaligen Turbulenzen. Auf Aachener Seite arbeiten in diesem Projekt das IT Center, die Universit\u00e4tsbibliothek und als Datenlieferant das Institut f\u00fcr Technische Verbrennung (Prof. Pitsch) zusammen. Die Simulationen haben die Form von Kuben mit unterschiedlich gro\u00dfer Aufl\u00f6sung. Diese liegen als HDF5-Dateien mit einer Gr\u00f6\u00dfe von 609 GB bis zu 7 TB vor. Da sie f\u00fcr den Austausch \u00fcber das Netz und die Nachnutzung au\u00dferhalb von HPC-Systemen nicht handhabbar sind, werden die Kuben zus\u00e4tzlich in Teile zerlegt, die eine minimale Gr\u00f6\u00dfe von 1 GB haben. Im Nachnutzungsszenario k\u00f6nnen Forschende dann einen einzelnen Ausschnitt und bestimmte Zeitschritte anfordern.<\/p>\n<p>Die Herausforderungen bestehen zum einen in der Konfiguration der Software f\u00fcr den eigenen Use Case, die die einliefernden Einrichtungen selbst vornehmen. Zum anderen ist das automatische Erstellen von Metadaten f\u00fcr die vielen Teildateien ein interessanter Testfall. Aufgrund der Gr\u00f6\u00dfe der Daten ist aber auch deren Transfer nicht ganz einfach.<\/p>\n<p>Tests mit einzelnen Dateien auf der Testinstanz des hbz waren bereits erfolgreich. Derzeit wird das Produktivsystem vorbereitet, auf dem dann im n\u00e4chsten Schritt die automatisierte Verarbeitung von gr\u00f6\u00dferen Datenmengen getestet wird.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Die Software Rosetta ist eine Software der Firma ExLibris f\u00fcr die Langzeitarchivierung von Daten. Das bedeutet vor allem, dass sie neben den Standardfunktionen eines Archiv-Systems (\u201ebitstream-preservation\u201c, regelm\u00e4\u00dfige Integrit\u00e4tstests, Reduplizierung, \u2026) [&hellip;]<\/p>\n","protected":false},"author":375,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"c2c_always_allow_admin_comments":false,"footnotes":""},"categories":[305],"tags":[],"class_list":["post-1680","post","type-post","status-publish","format-standard","hentry","category-themen"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/posts\/1680","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/users\/375"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/comments?post=1680"}],"version-history":[{"count":2,"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/posts\/1680\/revisions"}],"predecessor-version":[{"id":17519,"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/posts\/1680\/revisions\/17519"}],"wp:attachment":[{"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/media?parent=1680"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/categories?post=1680"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/tags?post=1680"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}