Schlagwort: ‘Archiv’
Happy World Digital Preservation Day!
Wie an jedem ersten Donnerstag des Novembers ist auch heute wieder “World Digital Preservation Day”. Der Aktionstag wird von der Digital Preservation Coalition (dpc) ausgerufen:
“Das Ziel des World Digital Preservation Day ist es, ein größeres Bewusstsein für digitale Langzeitarchivierung zu schaffen, was sich in einem breiteren Verständnis niederschlägt, das alle Aspekte der Gesellschaft durchdringt – Wirtschaft, Politikgestaltung, persönliche gute Praktiken.” (Quelle)
Read the rest of this entry »FDM Statistik: 1 Petabyte im Archiv
Vor einigen Wochen haben wir in der Reihe FDM Statistik bereits über die Entwicklung der Nutzung des Archivs berichtet. In 2018 waren durchschnittlich 848 Terabyte Daten im Archiv gespeichert. Nun hat der Dienst am 23.05.2019 einen neuen Meilenstein erreicht: 1 Petabyte – 1.024 Terabyte = ~1015 Byte. Matías de la Fuente vom Lehrtuhl für Medizintechnik hat mit seinen Daten das letzte Byte gesichert, das die 1-Petabyte-Marke geknackt hat.
Read the rest of this entry »FDM Statistik: 100 Gigabyte Daten in simpleArchive
Im Rahmen der Serie „FDM Statistik“ stellen wir Ihnen heute das Thema simpleArchive vor.
Lesen Sie im Folgenden, wie sich die Nutzung von simpleArchive in den letzten Jahren entwickelt hat und warum sich simpleArchive auch im Kontext Forschungsdatenmanagement gut eignet.
Read the rest of this entry »FDM Statistik: 848 TB im Archiv
In einer kurzen Serie “FDM Statistik” möchten wir Ihnen die Entwicklungen bei der Nutzung verschiedener Dienste vorstellen, die beim Forschungsdatenmangament, kurz FDM, zur Anwendung kommen. Heute steht mit diesem ersten Beitrag das Archiv auf dem Programm.
Lesen Sie im Folgenden, wie sich die Nutzung des Archivs in den letzten Jahren entwickelt hat und warum sich der Archiv-Dienst auch im Kontext FDM gut eignet.
Read the rest of this entry »Neues Lehrvideo – Forschungsdaten zu Publikationen
Das FDM-Team an der RWTH Aachen University hat in Zusammenarbeit mit den Kolleginnen und Kollegen der Serviceeinheit Medien für die Lehre das Lehrvideo “Forschungsdaten zu Publikationen” veröffentlicht.
Das Video erklärt am fiktiven Beispiel der Eichhörnchenforschung, wie mit Forschungsdaten, die Grundlage einer Publikation sind, verfahren werden sollte.
Forschungsdaten archivieren leicht gemacht
RWTH Publications bietet nun einen direkten Link zum Archivsystem der RWTH Aachen an, um Forschungsdaten zu Publikationen schnell und einfach zu archivieren. Durch Verlinkung der archivierten Daten unter dem Reiter „References“ wird auf die Existenz der Forschungsdaten hingewiesen, Sie finden alle relevanten Daten ohne zu suchen und andere Forscher können Kontakt mit Ihnen aufnehmen und Sie um Zugriff auf die Daten bitten.
Viele wissenschaftliche Publikationen beruhen auf Forschungsdaten. Diese Daten erscheinen in Textpublikationen häufig nur als Graphik oder als abgeleitete statistische Werte. Nicht selten sind sie zu umfangreich, um vollständig und nachnutzbar abgebildet zu werden. Diese Forschungsdaten stellen jedoch einen wichtigen Teil Ihrer wissenschaftlichen Leistung dar und können wertvoll bezüglich zukünftiger Forschung sein.
Zudem erfordert es die gute wissenschaftliche Praxis, “Primärdaten als Grundlagen für Veröffentlichungen auf haltbaren und gesicherten Trägern in der Institution, wo sie entstanden sind, zehn Jahre lang aufzubewahren”. Die RWTH Aachen University ermöglicht dieses durch das Angebot von DigitalArchiv und SimpleArchive. Über eine Referenzierung in RWTH Publications werden Publikationen und die zugehörigen Forschungsdaten verlinkt.
Wie das geht erklären wir in der der Anleitung „Archivierung von Daten zu einer Publikation“.
Wenn keine Argumente wie beispielsweise der Schutz personenbezogener Daten oder Ihr weiteres Verwertungskonzept dagegen sprechen, haben Sie darüber hinaus die Möglichkeit, Ihre Forschungsdaten vergleichbar einer Textpublikation zu veröffentlichen. Sie können dafür ebenfalls RWTH Publications nutzen. Ihre Forschungsdaten sind dann weltweit auffindbar, öffentlich zugreifbar, bekommen einen eigenen Digital Object Identifier (DOI) und sind damit eigenständig zitierbar.
Gerne beraten wir Sie zu den Themen Archivierung und Publikation von Forschungsdaten. Bitte vereinbaren Sie einen Termin über das IT-ServiceDesk.
8. DINI/nestor Workshop „Forschungsdatenrepositorien“
Am 27. und 28. November fand der 8. DINI/nestor-Workshop der Arbeitsgemeinschaft Forschungsdaten innerhalb der Deutschen Initiative für Netzwerkinformation e. V. (DINI) in Stuttgart statt. Die DINI widmet sich dem Wandel der Informationsinfrastrukturen in Hochschulen und anderen Forschungseinrichtungen, der durch die Entwicklung moderner Informations- und Kommunikationstechnologie hervorgerufen wird. „DINI wurde gegründet, um die Verbesserung der Informations- und Kommunikationsdienstleistungen und die dafür notwendige Entwicklung der Informationsinfrastrukturen an den Hochschulen regional und überregional zu fördern“ (Quelle). Die RWTH Aachen University war mit zwei Beiträgen an diesem Workshop beteiligt.
Dominik Schmitz (Universitätsbibliothek, RWTH Aachen University) und Marius Politze (IT Center, RWTH Aachen University) referierten über die Verknüpfung von Publikationen und Forschungsdaten in einem Invenio-basierten Repositorium. Die Universitätsbibliothek (UB) der RWTH Aachen betreibt mit RWTH Publications ein Repositorium mit den Funktionen: Publikationsnachweis, Publikationsserver, Forschungsdatenveröffentlichung und Verknüpfung zwischen Publikationen und veröffentlichten oder archivierten Forschungsdaten. Das Repositorium basiert auf der am CERN entwickelten Repositoriumssoftware Invenio, die im Rahmen des Projekts join2 gemeinschaftlich mit den Helmholtz-Einrichtungen DESY Hamburg, DKFZ Heidelberg, GSI Darmstadt und Forschungszentrum Jülich erheblich weiter entwickelt wurde. Zentrale Elemente sind umfangreiche Importmöglichkeiten sowie die aufwändige Verknüpfung der erfassten Daten mit geeigneten Normdaten zu Personen, Instituten, Periodika und Projekten sowie der Datensätze untereinander.
Die UB ist als Datenzentrum bei der Technischen Informationsbibliothek Hannover (TIB) registriert und vergibt über diesen Weg DOIs für die im Repositorium veröffentlichten Volltexte und Forschungsdaten. Forschungsdaten werden aktuell vor allem im Kontext von Dissertationen mit veröffentlicht. Um den essentiell wichtigen Link zwischen Publikationen und den zugrundeliegenden Daten nicht zu verlieren, ist das Repositorium explizit darauf ausgelegt, Publikationen auch dann mit Daten verknüpfen zu können, wenn diese nicht veröffentlicht sind, sondern z.B. durch die Anwendung SimpleArchive im Archivsystem der RWTH gespeichert werden. Zudem besteht die bereits gerne genutzte Möglichkeit, im Repositorium Datensätze und Daten zu speichern, die nur für das jeweilige Institut zugänglich sind. Auf diese Weise ist eine verlässliche Dokumentationsumgebung entstanden, die die Verbindung zwischen Daten und Publikationen fokussiert und gleichzeitig Skalierungsmöglichkeiten für die vielen unterschiedlichen Anforderungen zum Grad der Zugänglichkeit von Informationen ermöglicht.
Das Repositorium ist Teil einer umfassenderen Service-orientierten Gesamtinfrastruktur für die Unterstützung von vielfältigen Forschungsdatenmanagementprozessen. Diese integrierte IT Landschaft nutzt Technologien wie Single Sign On und aufeinander abgestimmte und vernetzte User Interfaces um die Nutzerfreundlichkeit zu verbessern.
In einem weiteren Beitrag stellte Bela Brenger (IT Center, RWTH Aachen) zusammen mit Ania López (UB Duisburg-Essen), Stephanie Rehwald (UB Duisburg-Essen), Stefan Stieglitz und Konstantin Wilms (Universität Duisburg-Essen, Abteilung für Informatik und Angewandte Kognitionswissenschaft) das UNEKE-Projekt vor. Das Projekt reagiert auf die Forderung des Rates für Informationsinfrastrukturen, langfristig eine Nationale Forschungsdateninfrastruktur (NFDI) zu etablieren, die flächendeckend die Grundversorgung mit FDM-Speicherinfrastrukturen und -Services sicherstellt. Bisher besteht neben gut ausgebauten Infrastrukturen einzelner Fach-Communities eine Vielzahl von Insellösungen an den Hochschulen für die Vorhaltung von Forschungsdaten. Interoperabilität sowie Migrierbarkeit sind zentrale Anforderungen beim Auf- und Ausbau institutioneller Speicherkonzepte, um die Anschlussfähigkeit an möglicherweise entstehende fachspezifische oder nationale Lösungen zu sichern. Damit stehen Hochschulen bei der Implementierung ihrer Forschungsdateninfrastruktur vor der Entscheidung, ob auf dem Weg zur NFDI für die Speicherung von Forschungsdaten lokale Speicherstrukturen und Repositorien nötig sind oder bestehende externe Angebote genutzt werden können. Hierfür fehlen bisher objektive Kriterien.
Das BMBF-geförderte Kooperationsprojekt UNEKE der Universität Duisburg-Essen und der RWTH Aachen entwickelt und evaluiert diese Kriterien und bettet diese in eine Roadmap ein, die sowohl die individuellen Rahmenbedingungen der Hochschulen als auch fachspezifische Bedarfe berücksichtigt. Der Vortrag stellte das Projekt sowie eine erste Version des Kriterienkatalogs zur Auswahl von Speicherlösungen auf Grundlage der in Interviews und Workshops erhobenen Bedarfe der Wissenschaftler/innen vor.
Langzeitverfügbarkeit digitaler Daten an der RWTH
Die Sicherstellung der Langzeitverfügbarkeit (LZV) von elektronischen Daten, die an der RWTH in großem Umfang produziert werden, umfasst folgende drei Ebenen:
- Die Integrität der Daten muss sichergestellt werden, sodass die Dateien lesbar bleiben. Dies wird auch als sogenannten „Bit Stream Preservation“ bezeichnet.
- Um die Daten langfristig nutzen zu können, ist es darüber hinaus erforderlich, die technische Lesbarkeit der Dateiformate sicherzustellen. Sollte beispielsweise ein „altes“ Dateiformat von aktuellen Versionen eines Anwendungsprogramms nicht mehr gelesen werden können, ist eine Formatkonversion erforderlich. Dies wird als „logical Preservation“ bezeichnet.
- In der dritten Ebene, der sogenannten „Semantic Preservation“ wird die inhaltliche Interpretierbarkeit der Dateninhalte sichergestellt.
Die erste Ebene der „Bit Stream Preservation“ wird bereits durch das Archivangebot des IT Centers abgedeckt. Um dies zu einem ganzheitlichen LZV Angebot auszubauen, beteiligt sich die RWTH als Pilotpartner am NRW-Projekt „Langzeitverfügbarkeit für Hochschulen“. Dabei finanziert das Land Beschaffung, Aufbau und Inbetriebnahme einer landesweiten Lösung, die auf der Software Rosetta der Firma Ex Libris basiert. Federführend für den Aufbau ist das Hochschulbibliothekszentrum, kurz hbz, in Köln. Zum Projektstart, hat die RWTH die Pressemitteilung “Digitales Wissen langfristig sichern und verbreiten” verfasst.