{"id":1794,"date":"2017-11-29T14:00:16","date_gmt":"2017-11-29T12:00:16","guid":{"rendered":"https:\/\/blog.rwth-aachen.de\/itc\/?p=1794"},"modified":"2026-02-10T17:38:52","modified_gmt":"2026-02-10T16:38:52","slug":"die-lebensdauer-von-daten-verlaengern","status":"publish","type":"post","link":"https:\/\/blog.rwth-aachen.de\/itc\/en\/2017\/11\/29\/die-lebensdauer-von-daten-verlaengern\/","title":{"rendered":"Die Lebensdauer von Daten verl\u00e4ngern"},"content":{"rendered":"<div class=\"twoclick_social_bookmarks_post_1794 social_share_privacy clearfix 1.6.4 locale-en_US sprite-en_US\"><\/div><div class=\"twoclick-js\"><script type=\"text\/javascript\">\/* <![CDATA[ *\/\njQuery(document).ready(function($){if($('.twoclick_social_bookmarks_post_1794')){$('.twoclick_social_bookmarks_post_1794').socialSharePrivacy({\"txt_help\":\"Wenn Sie diese Felder durch einen Klick aktivieren, werden Informationen an Facebook, Twitter, Flattr, Xing, t3n, LinkedIn, Pinterest oder Google eventuell ins Ausland \\u00fcbertragen und unter Umst\\u00e4nden auch dort gespeichert. N\\u00e4heres erfahren Sie durch einen Klick auf das <em>i<\\\/em>.\",\"settings_perma\":\"Dauerhaft aktivieren und Daten\\u00fcber-tragung zustimmen:\",\"info_link\":\"http:\\\/\\\/www.heise.de\\\/ct\\\/artikel\\\/2-Klicks-fuer-mehr-Datenschutz-1333879.html\",\"uri\":\"https:\\\/\\\/blog.rwth-aachen.de\\\/itc\\\/en\\\/2017\\\/11\\\/29\\\/die-lebensdauer-von-daten-verlaengern\\\/\",\"post_id\":1794,\"post_title_referrer_track\":\"Die+Lebensdauer+von+Daten+verl%C3%A4ngern\",\"display_infobox\":\"on\"});}});\n\/* ]]> *\/<\/script><\/div><p><\/p>\n<h3>Archivierung<\/h3>\n<div id=\"attachment_1795\" style=\"width: 310px\" class=\"wp-caption alignright\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-1795\" class=\"wp-image-1795 size-medium\" src=\"https:\/\/blog.rwth-aachen.de\/itc\/files\/2017\/11\/book-283251_1920-300x201.jpg\" alt=\"\" width=\"300\" height=\"201\" srcset=\"https:\/\/blog.rwth-aachen.de\/itc\/files\/2017\/11\/book-283251_1920-300x201.jpg 300w, https:\/\/blog.rwth-aachen.de\/itc\/files\/2017\/11\/book-283251_1920-768x514.jpg 768w, https:\/\/blog.rwth-aachen.de\/itc\/files\/2017\/11\/book-283251_1920-1024x685.jpg 1024w, https:\/\/blog.rwth-aachen.de\/itc\/files\/2017\/11\/book-283251_1920.jpg 1920w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><p id=\"caption-attachment-1795\" class=\"wp-caption-text\">Quelle: <a href=\"https:\/\/pixabay.com\/photos\/books-library-education-knowledge-283251\/\">Pixabay<\/a><\/p><\/div>\n<p>Auf dem IT Center Blog wurde bereits die <a href=\"https:\/\/blog.rwth-aachen.de\/itc\/2017\/11\/03\/rosetta-eine-kooperation-des-hochschulbibliothekszentrums-nrw-und-der-rwth-aachen\/\">Kooperation zwischen dem Hochschulbibliothekszentrum NRW und der RWTH Aachen<\/a> vorgestellt. Die innerhalb der Kooperation f\u00fcr das Forschungsdatenmanagement getestete Software Rosetta dient der Langzeitarchivierung von Daten. Doch was bedeutet eigentlich Archivierung? Und was genau hei\u00dft Langzeitarchivierung von Daten?<\/p>\n<p>Digitale Daten zu archivieren bedeutet, sicherzustellen, dass die Daten auch zuk\u00fcnftig noch genauso verf\u00fcgbar sind, wie sie archiviert wurden. Dieser Aspekt wird als <a href=\"http:\/\/www.forschungsdaten.org\/index.php\/Bitstream_Preservation\"><em>bitstream preservation<\/em><\/a> bezeichnet. Der ungef\u00e4hre zeitliche Horizont dieser Art von Datensicherung wird durch die Vorgabe der Guten wissenschaftlichen Praxis definiert, Forschungsdaten mindestens zehn Jahre lang aufzubewahren.<\/p>\n<p>Bitstream preservation h\u00e4lt allerdings keine L\u00f6sung f\u00fcr die Frage bereit, ob man mit den Daten auch nach zehn Jahren noch etwas anfangen kann.<\/p>\n<h3>Herausforderungen der Archivierung<\/h3>\n<p>Daten so zu speichern, dass sie auch nach l\u00e4ngerer Zeit noch in genau der gleichen Form verf\u00fcgbar sind, erscheint zun\u00e4chst einmal selbstverst\u00e4ndlich und nicht besonders schwierig. Tats\u00e4chlich sind gespeicherte Daten aber betr\u00e4chtlichen Risiken ausgesetzt. Speichermedien haben eine begrenzte Lebenszeit. Nach einigen Jahren gehen zun\u00e4chst einzelne Bits verloren, die Daten sind nicht mehr vollst\u00e4ndig lesbar. St\u00f6rf\u00e4lle wie Virenbefall, Stromausf\u00e4lle, Ausfall von K\u00fchlsystemen oder gar Katastrophen wie Br\u00e4nde oder \u00dcberschwemmungen k\u00f6nnen zum sofortigen Verlust aller Daten f\u00fchren. M\u00f6glicherweise gibt es das Programm, mit dem die Daten verarbeitet werden, gar nicht mehr. Software, Betriebssysteme und Rechnerarchitekturen entwickeln sich weiter, was dazu f\u00fchren kann, dass alte Datenformate nicht mehr interpretiert werden k\u00f6nnen.<\/p>\n<h3>Langzeitarchivierung<\/h3>\n<p>Die <em>bitstream preservation<\/em> ist daher nur die halbe Miete, wenn es darum geht, Daten langfristig nutzbar zu halten. Verfahren der Langzeitarchivierung sind ein weiterer Beitrag zur vollst\u00e4ndigen Miete. Hier ist der Anspruch, Daten f\u00fcr potenziell unbegrenzte Zeit interpretierbar zu halten. F\u00fcr die L\u00f6sung dieses Problems gibt es zwei Ans\u00e4tze: Emulation und Migration\/Konversion.<\/p>\n<p>Der Ansatz der <strong><em>Emulation<\/em><\/strong> sieht vor, die f\u00fcr das Lesen und Bearbeiten der Daten n\u00f6tige Software und manchmal auch die komplette Betriebssystemumgebung in einer virtuellen Maschine (VM) mit zu archivieren (Kapselung), um diese dann in einem zuk\u00fcnftigen Computersystem mittels einer Emulationssoftware wieder nutzbar zu machen. Abgesehen davon, dass dies hohe Kosten verursachen kann, garantiert das Vorgehen aber noch immer nicht, dass die archivierte VM in Zukunft wieder funktionieren wird, die Emulation also gelingt.<\/p>\n<p>Die Software Rosetta der Firma Ex Libris, die vom Hochschulbibliothekszentrum (hbz) f\u00fcr die NRW-Hochschulen betrieben wird, verfolgt die andere Strategie der <strong><em>Migration\/Konversion<\/em><\/strong> archivierter Daten. Hier wird bei der Einlieferung der Daten deren Format gem\u00e4\u00df einer internationalen Formatdatenbank bestimmt und diese Metainformation mitgespeichert. Die Formatdatenbank PRONOM der <em>National Archives of the United Kingdom<\/em> wird kontinuierlich gepflegt und enth\u00e4lt auch Informationen \u00fcber die Verbreitung und Lesbarkeit von Datenformaten. Die <em>National Archives<\/em> stellen auch die Software DROID, die die automatisierte Formatbestimmung erm\u00f6glicht, zur Verf\u00fcgung. Diese Information nutzt Rosetta, um den\/die Datenkurator\/in zu warnen, wenn das Format der von ihr\/ihm eingelieferten Daten Gefahr l\u00e4uft, nicht mehr lesbar zu werden. Der\/die Kurator\/in kann dann Ma\u00dfnahmen ergreifen, um das Problem zu l\u00f6sen, wie etwa die Daten in ein anderes Format zu transformieren. Die Herstellerfirma Ex Libris, die <em>National Archives<\/em> und weitere Einrichtungen arbeiten auch daran, f\u00fcr weit verbreitete Formate entsprechende Konversionstools zu entwickeln.<\/p>\n<p>Rosetta setzt au\u00dferdem das <em>Open Archival Information System<\/em> (OAIS), das in der ISO-Norm 14721, beschrieben ist, um. Es sieht die Unterscheidung von Informationspaketen f\u00fcr verschiedene Zwecke vor: Daten werden zun\u00e4chst als <em>Submission Information Package<\/em> (SIP) eingeliefert. Nachdem alle Validierungsschritte erfolgreich waren, werden die Daten als <em>Archival Information Package<\/em> (AIP) archiviert, um bei Bedarf in ein <em>Dissemination Information Package<\/em> (DIP) kopiert und zur Nachnutzung ausgeliefert zu werden. Informationspakete enthalten neben den eigentlichen Daten auch Metadaten (wie z.B. das Dateiformat). Ist eine \u00dcbertragung in ein anderes Datenformat n\u00f6tig, wird diese Information ebenfalls im AIP gespeichert, so dass darin auch die gesamte \u00c4nderungshistorie der Daten verf\u00fcgbar ist.<\/p>\n<p>Auch wenn es gelingt, die technische Lesbarkeit der Daten und Metadaten zu erhalten, ist leicht vorstellbar, dass Menschen, die diese in 50 Jahren einmal nachnutzen wollen, auf die Qualit\u00e4t der Metadaten und Dokumentationen angewiesen sind, um die Daten zu verstehen \u2013 von der Spaltenbenennung \u00fcber die Beschreibung des Versuchsaufbaus bis hin zur Dokumentation der Forschungsfrage. Langzeitarchivierung beginnt also heute bei der Dokumentation und Beschreibung unserer Daten!<\/p>","protected":false},"excerpt":{"rendered":"<p>Sorry, this entry is only available in Deutsch.<\/p>\n","protected":false},"author":375,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"c2c_always_allow_admin_comments":false,"footnotes":""},"categories":[1574,305],"tags":[],"class_list":["post-1794","post","type-post","status-publish","format-standard","hentry","category-fdm","category-themen"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/posts\/1794","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/users\/375"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/comments?post=1794"}],"version-history":[{"count":4,"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/posts\/1794\/revisions"}],"predecessor-version":[{"id":23711,"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/posts\/1794\/revisions\/23711"}],"wp:attachment":[{"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/media?parent=1794"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/categories?post=1794"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.rwth-aachen.de\/itc\/en\/wp-json\/wp\/v2\/tags?post=1794"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}