Kategorien
Seiten
-

Forschungsdaten – Aktuelles und Wissenswertes

Kategorie: ‘Allgemein’

Objekt-Speicher für das Gemeinschaftslabor für Elektronenmikroskopie (GFE)

23. Oktober 2017 | von

Quelle: Pixabay

Objekt-Speicher sind eine relativ neue Art von Speichersystemen. Hier existieren keine konventionellen Dateisysteme, sondern jede Datei wird als individuell identifizierbares Objekt gespeichert und verwendet. Aus diesem Unterschied resultieren einige Besonderheiten, die Objekt-Speicher als besonders geeignet für Forschungsdatenmanagement (FDM) erscheinen lassen. So sind alle am Markt verfügbaren Systeme in Geschwindigkeit und Kapazität im laufenden Betrieb erweiterbar. Außerdem erlaubt die Technik sogenannte geoverteilte Redundanz, also eine Absicherung der Services und vor allem der gespeicherten Daten auch gegen den Ausfall eines Standortes. Mit konventioneller Technik könnte dies nur mit einer kompletten Verdoppelung des Speichervolumens und einer Datenspiegelung erreicht werden.

In den letzten Monaten hat das IT Center auf seiner Serverhosting-Infrastruktur eine Testumgebung eines Objekt-Speichers aufgebaut und funktionale Tests durchgeführt. Diese sind erfolgreich verlaufen, so dass das IT Center nun aus Eigenmitteln eine Pilot-Infrastruktur in der Größenordnung von 100 TB realisiert, um hiermit die Umsetzung von FDM weiter voranzutreiben.

Zu den ersten Pilot-Nutzern wird das Gemeinschaftslabor für Elektronenmikroskopie (GFE) gehören.

Moderne Elektronenmikroskope erzeugen aufgrund der neuen Generation schneller Detektoren in Kombination mit neuen analytischen Verfahren hohe Datenmengen. So wird z.B. an jedem Bildpunkt nicht nur eine Intensität, sondern ein kompletter Datensatz aus Beugungsintensitäten und spektroskopischen Daten hinterlegt, wodurch multidimensionale Datensätze mit hohen Anforderungen an die Speicherkapazität entstehen.

Diese erzeugten Daten und die beschreibenden Metadaten sind prototypisch für idealerweise in Objekt-Speichern ablegbare Daten. Die durch diese Kooperation gemachten Erfahrungen auf Nutzer- und Betreiberseite werden wertvolle Erkenntnisse für den weiteren Auf- und Ausbau dieser Infrastruktur liefern sowie die funktionalen Anforderungen der Nutzer an den Objekt-Speicher noch genauer spezifizieren.

Durch die partnerschaftliche Zusammenarbeit zwischen dem GFE und dem IT Center innerhalb dieses Pilotbetriebes wird auf die speziellen Bedarfe der Nutzer im Bereich FDM eingegangen, so dass das IT Center entsprechende angepasste Services anbieten kann.

Zeitstempel für Forschungsdaten

19. Oktober 2017 | von

Quelle: Pixabay

In Forschungsprozessen entstehen oftmals verschiedene Versionen eines Datensatzes. Der Umgang mit diesen Versionen ist ein Kernelement des Forschungsdatenmanagements. Manchmal ist es wichtig, den genauen Zeitpunkt der Entstehung eines Datensatzes nachweisen zu können – etwa im Zusammenhang mit dem Nachweis des Entstehungszeitpunkts von Erfindungen, Entwicklungen und Werken im Rahmen des Gewerblichen Rechtsschutzes und des Urheberrechts. Zu diesem Zweck werden Zeitstempel eingesetzt. Ein Zeitstempel ist laut Bundesamt für Sicherheit in der Informationstechnik die Bescheinigung einer vertrauensvollen Instanz, dass spezifische Daten zu einer bestimmten Zeit vorlagen (Quelle).

Die RWTH Aachen nutzt beim Einsatz von Zeitstempeln den Public Key Infrastruktur-Dienst des Deutschen Forschungsnetzes e.V., kurz DFN-PKI. Dieser Dienst ermöglicht es, Forschungsdaten an einen vom DFN betriebenen Server zu senden. Dieser ruft die aktuelle Zeit durch die Kommunikation mit einer Funkuhr ab und identifiziert die Version der empfangenen Daten mit der abgerufenen Zeit. Anschließend sendet er die eingangs empfangenen Daten mit einer entsprechenden Signatur, dem so genannten Zeitstempel, zurück. Der DFN-Zeitstempeldienst kann im Rahmen der DFN-Satzung für nicht gewerbliche Zwecke verwendet werden.

Um das Forschungsdatenmanagement an der RWTH Aachen weiter durch innovative Lösungen zu begleiten, bietet das IT Center der RWTH Aachen einen Dienst an, der es ermöglicht, eine Datei über eine Webseite mit einem zertifizierten DFN-PKI-Zeitstempel auszustatten. Der noch im Pilotbetrieb befindliche Zeitstempeldienst ist hier zu finden (http://zeitstempel.dfn.de).

Weitere Informationen zum Dienst sind im Dokumentationsportal des IT Centers zu finden und auf der Seite des Deutschen Forschungsnetzes.

 

Der Sinn von Forschungsdatenmanagement

17. Oktober 2017 | von

Quelle: Pixabay

Forschungsdatenmanagement umfasst alle Methoden und Verfahren, die Forschende nutzen können, um Forschungsdaten langfristig zu sichern, zu nutzen und um sicherzustellen, dass keine wertvollen Daten verloren gehen. Forschungsdatenmanagement erlaubt es, wissenschaftliches Arbeiten nachvollziehbar zu dokumentieren und Daten über die eigentliche Projektlaufzeit für weitere Vorhaben nutzbar zu machen. Gut archivierte Daten ermöglichen einen effizienten Zugriff auch unter veränderten Fragestellungen und führen zu neuen Projekten und Synergieeffekten. Auch Dritte haben durch Forschungsdatenmanagement die Möglichkeit, Forschungsleistungen wahrzunehmen und zwecks Kooperationen mit anderen Forschenden in Kontakt zu treten. Den Anforderungen öffentlicher, fördermittelvergebender Institutionen kommt das Forschungsdatenmanagement entgegen. Bei Anträgen für die Deutsche Forschungsgemeinschaft beispielsweise ist ein Datenmanagementplan mittlerweile unverzichtbar. Denn zunehmend erwarten Förderträger/innen, dass Forschungsdaten frei zur Verfügung gestellt werden und langfristig nutzbar sind.

Die RWTH Aachen widmet sich daher intensiv allen Fragen und Prozessen zum Forschungsdatenmanagement und möchte Sie dabei unterstützen. Wir beantworten gerne Ihre Fragen und helfen Ihnen bei der Entwicklung fachspezifischer Lösungen. Näheres erfahren Sie auf der Webseite des Forschungsdatenmanagements.

 

Workshop zur Nutzung elektronischer Laborbücher

13. Oktober 2017 | von

Quelle: Pixabay

Die gute wissenschaftliche Praxis erfordert die nachvollziehbare Dokumentation von Forschungsergebnissen. Planung, Durchführung und Auswertung wissenschaftlicher Experimente werden üblicherweise in sogenannten Laborbüchern dokumentiert. Elektronische Laborbücher (ELN) besitzen das Potential, Forschende bei der z.T. aufwändigen Dokumentationsarbeit zu unterstützen und Laborprozesse zu optimieren. Im Rahmen des Forschungsdatenmanagements stellen ELN mit der Digitalisierung von Forschungsprozessen und Dokumentationen eine wichtige Schnittstelle dar, um langfristig verfügbare, digital auswertbare Forschungsdaten zu generieren und der wissenschaftlichen Community zur Verfügung zu stellen sowie die überregionale und internationale Kooperation zu stärken.

Jedoch bergen neue Potentiale auch Herausforderungen. Momentan existieren unterschiedliche, den jeweiligen Bedürfnissen der Forschungsgemeinschaft angepasste ELN-Modelle. Das IT Center bietet daher am 20.11.2017 einen Workshop an, um sich mit verschiedenen Lösungen vertraut zu machen und zu prüfen, welche Lösung zu den eigenen Ansprüchen passt. Neben Live-Demos verschiedener Systeme und Fachvorträgen wird es die Möglichkeit zu einem lösungsorientierten Austausch mit Anwendenden und Entwickelnden geben.

Alle weiteren Informationen und die Möglichkeit, sich bis zum 12.11.2017 anzumelden, finden Sie auf der Webseite der Digitalen Hochschule NRW.

Persistent Identifier – eine dauerhafte Identifikation der eigenen Forschungsergebnisse

10. Oktober 2017 | von

Quelle: Pixabay

Wissenschaftliche Ergebnisse sind das Resultat einer oftmals langen, teils kooperativ organisierten, Forschungstätigkeit. Ein Ziel guter wissenschaftlicher Praxis ist es, Forschungsdaten langfristig und dauerhaft zu sichern und bei Bedarf wieder bereitstellen zu können. Um diese Ziele zu erreichen, können sogenannten Persistent Identifier (PID) eingesetzt werden. Ein PID ermöglicht es, den Speicherort der Daten, die zu den Daten zugehörige Forschungseinrichtung und ggf. weitere Kontextinformationen, wie die Forschenden, die die Daten generiert haben, eindeutig zu identifizieren. Über den PID können Forschende auch nach ihrem Ausscheiden aus den Einrichtungen Forschungsdaten referenzieren und so auf ihre wissenschaftlichen Ergebnisse verweisen. Ebenfalls ist es möglich, den Speicherort von Daten zu aktualisieren, ohne dass der PID sich ändert. Ein klassisches Beispiel für einen PID ist der Digital Object Identifier (DOI), der insbesondere für Online-Artikel wissenschaftlicher Fachzeitschriften und für die Publikation von Forschungsdaten verwendet wird.

Die Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG) bietet einen Service für die Verwendung von PIDs an, den die RWTH Aachen nutzt, um Forschenden die Sicherung und erneute Bereitstellung ihrer Daten zu erleichtern. Dieser kooperativ erbrachte Service bietet neben der Möglichkeit, PIDs zu erstellen, eine IT-Infrastruktur, die die dauerhafte Auflösung von PIDs gewährleistet.

Zugleich greift die RWTH Aachen bei der Unterstützung im Umgang mit PIDs auf bereits bestehende Dienste des IT Centers und der Universitätsbibliothek zurück. Beispielsweise können durch den Einsatz von PIDs die über das Backup-Portal gesicherten Daten problemlos eindeutig referenziert und mit einer zugehörigen Publikation in RWTH Publications verknüpft werden. Die RWTH Aachen stellt zudem einfach zu nutzende Web-basierte Tools bereit, die beim Erzeugen und Editieren von PIDs unterstützen. Informationen zum PID-Service finden Sie in der Dokumentation. Zudem beraten wir Sie gerne bei Ihrem Vorhaben, PID-Services in die Forschungspraxis zu integrieren. Kontaktieren Sie uns einfach über das IT-ServiceDesk.

Gewusst wie: professioneller Umgang mit Forschungsdaten

04. Oktober 2017 | von

Quelle: Pixabay

Die Generierung, Sicherung und Bereitstellung von Forschungsergebnissen sind integraler Bestandteil des wissenschaftlichen Arbeitens. Die digitale Revolution ermöglicht es auf neuen Wegen, Forschungsdaten effektiv und effizient zu verarbeiten und der wissenschaftlichen Community zur Verfügung zu stellen.

Die RWTH Aachen University unterstützt ihre Angestellten aus Forschung sowie aus Technik und Verwaltung beim Begehen dieser neuen Wege durch Infrastrukturangebote ebenso wie durch ein umfassendes Beratungs- und Schulungsangebot. Das Spektrum reicht von einer allgemeinen Einführung in die Thematik über das Erstellen von Datenmanagementplänen bis hin zur Vertiefung spezifischer Themen wie der Archivierung und Publikation von Forschungsdaten. Die Kurse bieten Ansätze, das persönliche Datenmanagement oder die datenbezogene Zusammenarbeit in der Gruppe zu optimieren sowie Forschungsdaten im Sinne der guten wissenschaftlichen Praxis nachhaltig zu sichern oder zur Nachnutzung bereitzustellen. Die Angebote sind in deutscher und teilweise auch in englischer Sprache verfügbar.

Weitere Informationen finden Sie auf der Seite zum Forschungsdatenmanagement und in der Veranstaltungsdatenbank zur Personalentwicklung der RWTH Aachen University. Individuelle Beratungs- oder Schulungstermine für Institute oder Arbeitsgruppen können gerne über das IT-ServiceDesk vereinbart werden.

 

Neue Herausforderungen bedürfen neuer Fachleute: DataScienceMATSE

26. September 2017 | von

Die Digitalisierung der Arbeitswelt, die sich in den Begriffen der Industrie 4.0 und des Internets der Dinge ausdrückt, führt dazu, dass große Mengen an digitalen Daten produziert, abgelegt und weiterverwendet werden. Große heterogene, nicht vorstrukturierte und bisweilen lückenhafte Datenmengen, die von Menschen ohne Hilfsmittel der Softwaretechnik nicht mehr zu bearbeiten sind, werden als Big Data bezeichnet.

Quelle: Pixabay

Auch Forschungsdaten sind sehr heterogen, liegen oftmals in großer Menge vor, sind an unterschiedlichen Orten abgelegt und können daher als Big Data begriffen werden. Unter Forschungsdaten versteht man die Gesamtmenge aller im Rahmen von Forschungsarbeiten anfallenden Daten in verschiedenen Arten und Formaten. Umfrageergebnisse, entwickelte Computermodelle oder Software zählen in dieser weitreichenden Definition genauso zu den Forschungsdaten wie die Messwerte aus Experimenten.

Eine große Herausforderung stellt der nachhaltige und strukturierte Umgang mit diesen Daten dar, der entsprechend der guten wissenschaftlichen Praxis eine langfristige und nachhaltige Archivierung ermöglicht und ggf. eine effektive und effiziente Nachnutzung der Daten erlaubt. Auch zur Umsetzung und Anwendung von Big Data Technologien auf Forschungsdaten werden hochqualifizierte Fachleute benötigt.

Die RWTH Aachen University widmet sich diesen Herausforderungen unter anderem durch die Spezialisierung des/der Mathematisch-technischen Softwareentwicklers/in (MATSE) zum/r DataScienceMATSE. Im Rahmen der Ausbildung lernen die zukünftigen DataScienceMATSE die Erfassung, Aufbereitung, Verarbeitung, Darstellung und Interpretation sehr großer Datenmengen. Zudem werden sie im Umgang mit spezifischer Auswertungssoftware geschult und erlangen entsprechende Programmierkenntnisse sowie adäquates mathematisches und statistisches Fachwissen.

Weitere Informationen zum Thema finden Sie auf den entsprechenden Webseiten des IT Centers.

Go-Live von simpleArchive

12. September 2017 | von

*** Update: Am 5. Oktober 2021 wurden die Funktionen der Anwendung simpleArchive abgeschaltet und durch den Dienst Coscine abgelöst. Weitere Informationen dazu finden Sie in der Meldung zur Abschaltung von simpleArchive . ***

Der neue Dienst simpleArchive hat nun den Betrieb aufgenommen.

 

simpleArchive ist eine Webanwendung, die es RWTH-Mitarbeitenden ermöglicht, über eine Webseite einzelne Dateien bis zu 2GB zu archivieren. Die Dateien werden hochgeladen und dann im Hintergrund im TSM-System archiviert. Wiederhergestellte Daten werden über GigaMove zum Download zur Verfügung gestellt oder können über diesen Dienst mit anderen Personen geteilt werden.

 

simpleArchive ermöglicht es Forschenden, die in den Regeln der guten wissenschaftlichen Praxis vorgegebene Aufbewahrung ihrer Forschungsdaten für mindestens zehn Jahre einfach zu realisieren und ist damit ein wichtiger Baustein im Forschungsdatenmanagement.

Testbetrieb RWTH-Metadatentool

17. Januar 2017 | von

Metadaten sind ein wichtiges Mittel, um Forschungsdaten auffindbar und nachnutzbar zu machen. Im Rahmen des Projekts zum Forschungsdatenmanagement an der RWTH Aachen wurde ein Metadatentool entwickelt, das sich nun im Testbetrieb befindet.

Die Webanwendung ermöglicht allen Mitarbeitenden der RWTH die strukturierte Erfassung von Metadaten gemäß eines vorgegebenen Schemas. Als Default steht das RADAR-Metadatenschema zur Verfügung. Die eingegebenen Metadaten können in einer zentralen Datenbank abgelegt werden. Alternativ können Sie aber auch eine RDF-formatierte XML-Datei Ihrer Metadaten herunterladen, ohne dass Daten zentral gespeichert werden.

Nutzen Sie bereits ein eigenes Schema zur Beschreibung Ihrer Forschungsdaten? Gibt es in Ihrem Fachbereich geeignete Metadatenschemata? Das Tool ist offen, weitere Schemata zu implementieren. Sofern es für Ihr Fachgebiet bereits ein etabliertes Metadatenschema gibt, setzen wir dieses in der Anwendung für Sie um. Gerne beraten wir Sie zu dem Thema und unterstützen Sie bei der Erarbeitung eines angepassten Metadatenschemas für Ihre Einrichtung. Kontaktieren Sie einfach das IT-ServiceDesk.

Das Metadatentool wird kontinuierlich weiter entwickelt, so dass Sie uns mit Ihrem Feedback sehr helfen!

Neue Informations­plattform zum Forschungsdatenmanagement

22. Dezember 2016 | von

Finanziert von Baden-Württembergs Ministerium für Wissenschaft, Forschung und Kunst ist jetzt die Informations­plattform forschungsdaten.info online. Sie richtet sich explizit an Wissenschaftlerinnen und Wissenschaftler und bietet eine kompakte und trotzdem sehr informative Einführung in den Themenkomplex des Forschungs­daten­managements.

Neben den thematisch übersichtlich strukturierten Informationen zum Forschungsdatenmanagement finden Sie unter Praxis kompakt weiterführende Links zu Videos, Anleitungen und Tools anderer Anbieter. Damit lädt die Informationsseite gleichermaßen zum Stöbern, Nachschlagen und Einsteigen in die Materie ein!