Kategorien
Seiten
-

IT Center Blog

Archivmigration – der große Umzug archivierter Daten

26. März 2021 | von

Quelle: Unsplash

Der Service Archiv ermöglicht RWTH-Mitarbeitenden Datenbestände auf einem Bandrobotersystem langfristig abzulegen. Das Archivieren von Daten auf diese Art und Weise dient dabei vor allem der Aufbewahrung von Datenbeständen, die einmal abgelegt, auch in dieser Form langfristig gespeichert werden sollen.
In der Vergangenheit wurden hier Datenbestände abgelegt, die vor allem Messergebnisse, abgeschlossene Projekte oder Projektschriften dokumentieren. Mit den Veränderungen in der Förderlandschaft, die u. a. auch das Nachhalten von Forschungsdaten neu denken und fordern, wird auch der Service Archiv neu gedacht. Dies liegt zum einen daran, dass das aktuelle Bestandsystem im Sommer 2022 außer Betrieb genommen wird und zum anderen, dass die Notwendigkeit besteht, Daten zukünftig strukturiert vorzuhalten. Es ist also Zeit für eine Umstellung.

Aber keine Sorge, die Daten gehen nicht verloren: Alle Daten im bisherigen Archivsystem werden migriert, sodass auch zukünftig darauf zugegriffen werden kann. Was es mit dieser Archivmigration auf sich hat und was euch erwartet, erklären wir euch in diesem Beitrag.

Technologiewechsel – von Band zum Objektspeicher

Aufgrund der Veränderungen in Technologie und Förderlandschaft werden die Archivdaten ab Sommer 2021 auf eine S3 Objektspeicherinfrastruktur migriert. Die Vorteile dieser Speicherinfrastruktur gegenüber dem bisher genutzten Bandrobotersystem sind nicht nur das einfache und schnelle Einliefern von Daten über das S3-Protokoll, sondern auch der Zugriff auf die archivierten Daten. Während der Retrieve – also das Einholen der archivierten Daten – bisher recht aufwändig war, wird dies künftig bequemer und effizienter. Darüber hinaus wird die Sicherheit gegenüber Datenverlust deutlich erhöht, aufgrund der geografischen Verteilung der Speicherorte (Stichwort Georedundanz).

Archiv – eine Speicherstätte vielfältiger Daten

Mit der fortschreitenden Digitalisierung und der stetig steigenden Vielfalt von Daten, wachsen nicht nur Datenmengen, sondern auch die Anforderungen an das langzeitige Vorhalten ebenjener. Wir alle kennen es: Wenn wir keine Struktur auf unseren speichernden Medien oder Geräten hätten, würde sich das Wiederfinden wesentlich schwieriger gestalten, ganz zu schweigen vom

Bearbeiten, Teilen und Sichten der Daten. Das Archiv, wie wir es kennen, beinhaltet auf den vielen Archivknoten Daten aus Forschung, Lehre und Verwaltung ohne übergeordnete Sortierkriterien und ohne Qualifizierung bzw. Klassifizierung. Dies soll sich mit der Migration ändern, die diese Gelegenheit bietet.

Einzig und allein die Person, die die Daten archiviert hat, weiß im besten Falle noch, worum es sich dabei handelte. Dies setzt auf Seiten der Nutzenden voraus, dass sie selbst eine Übersicht pflegen, die Aufschluss über archivierte Daten liefert oder den Überblick behalten. Mit der Migration  werden diese wichtigen Informationen in Form von Metadaten direkt mit dem zu archivierenden Bestand abgelegt.

Übersicht der technischen Planung des Migrationsprozesses von Archivdaten bis zu den Zielorten Coscine und Digitalarchiv
Quelle: Eigene Darstellung

Wohin werden die Daten migriert?

Hier kommen die dedizierten Speicher Coscine und Digitalarchiv ins Spiel sowie die Eingabe von Metadaten. Mit dem Migrationsvorhaben werden die aktuellen Archivknotenbesitzenden dazu aufgerufen für die zu migrierenden Archivknoten Metadaten einzugeben: Anhand der Metadaten werden die bestehenden Archivknoten klassifiziert. Die Nutzenden entscheiden somit, ob es sich um Forschungsdaten handelt, die nach Coscine mit dem entsprechenden Metadatensatz migriert werden, oder ob das Digitalarchiv für sonstige Daten z.B. aus Lehre und Verwaltung der richtige Speicherort ist. Sind die Metadaten einmal erfasst, werden Sie zunächst zwischengespeichert und im Migrationsprozess mit den zu migrierenden Daten in einem sogenannten Bucket im Zielsystem zusammengeführt und abgelegt.

Migrationsprojekt mit Beteiligungsstruktur

Diese umfangreiche Umstellung bedarf einer gut strukturierten Organisation – sowohl innerhalb der RWTH Aachen als auch im IT Center. Aus diesem Grund wurde das Projekt „Archivmigration“ ins Leben gerufen. Das gesamte Projekt wurde auf fünf Teilprojekte verteilt, bei denen vor allem die Abteilungen IT-Prozessunterstützung Forschung & Lehre (IT-PFL) und Systeme & Betrieb (SuB) beteiligt sind.

Neben der technischen Migration der Archivknoten, vom Archivsystem auf die neue Infrastruktur, wird auch fleißig im Bereich Software entwickelt. Zum einen wird SeViRe um die Funktionen rund um das Digitalarchiv erweitert, während zeitgleich die Entwicklung zur Metadatenprozessierung vorangetrieben wird. Mit Coscine konnten die Kolleginnen und Kollegen bereits für die Archivierung von Forschungsdaten maßgebliche Vorbereitungen treffen.

Die technisch-prozessualen Teilprojekte werden durch ein dediziertes Kommunikationsteilprojekt ergänzt. Hier liegt der Fokus auf der Bereitstellung von Informationen an Nutzende und Supportleistende. Im Zuge dessen wurden bereits Informationsveranstaltungen organisiert, um Administrierende und Power User umfassend zu informieren. Ergänzend wurde auch eine Interessenvertretung initiiert, in der sowohl Erfahrungswerte von Archivnutzenden Eingang finden, als auch Anforderungen, Erwartungen und Wünschen Gehör geschenkt wird, um diese berücksichtigen zu können.

Wie ihr sicher vermutet, war dieser Beitrag also nur der Startschuss zur Archivmigration. Wenn ihr auf dem Laufenden bleiben wollt, folgt unserem Hashtag #ArMiRWTH. Wir informieren euch, sobald wir Neuigkeiten haben.

 

Verantwortlich für die Inhalte dieses Beitrags sind Lukas C. Bossert und Nicole Filla.

 

2 Antworten zu “Archivmigration – der große Umzug archivierter Daten”

  1. Elqatary sagt:

    Research data

    • Vreydal, Janin sagt:

      Hello Elqatary,
      thank you for your comment.
      If you have any questions about this topic, please feel free to contact us at the IT-Service Desk.
      Kind regards, the IT Center Blog Team.