Categories
Pages
-

Research Data – Latest News & Worth Knowing

Kategorie: ‘Allgemein’

Praxisorientierte Ratschläge zum Umgang mit Daten

September 9th, 2015 | by

This entry is only available in Deutsch.

Die Analyse von Daten ist eine Herausforderung, insbesondere wenn sich die Daten selbst oder die Auswertungskriterien laufend ändern, die eigenen Ressourcen schwanken, die Zeit knapp ist, nur eingeschränkte technische Werkzeuge zur Verfügung stehen, die Analysen aber trotzdem reproduzierbar und einfach erklärbar sein sollen.

Enda Ridge hat als “Data Scientist” in seinem Buch Guerrilla Analytics – A Practical Approach to Working with Data seine Best Practices für die Datenanalyse unter solchen Bedingungen in Form von sieben Prinzipien zusammengefasst und die Forschung als einen möglichen Anwendungsbereich benannt:

  1. Speicher ist billig, Verwirrung teuer.
  2. Projektstrukturen sollten einfach und visuell sein (keine umfangreich dokumentierten, projektspezifischen Regeln).
  3. Automatisierung mit Programmen ist dem manuellen Vorgehen in einer grafischen Bedienoberfläche vorzuziehen.
  4. Daten müssen zwischen Dateisystem, Analyseumgebung und dem abgelieferten Ergebnis identifzierbar und nachverfolgbar sein.
  5. Änderungen an Daten und Programmen sollten unter Versionskontrolle stehen.
  6. Kooperatives Wissen sollte in versionierten Builds gesammelt werden.
  7. Analyse-Code sollte von Anfang bis Ende ohne Unterbrechung ausführbar sein.

Auf seiner Webseite findet sich für jedes Prinzip eine kurze Begründung. Das Buch gibt darüber hinaus 90 praktische Tipps zusammen mit Beispielen und hat Eingang in das Programm unseres CDS-Seminars “Management von Forschungsdaten” (nächster Termin, Freitag 30.10.2015) gefunden.

Neues Glossar zum Forschungsdatenmanagement

August 21st, 2015 | by

This entry is only available in Deutsch.

Research Data Canada (RDC) startet in Zusammenarbeit mit dem internationalen Consortia Advancing Standards in Research Administration Information (CASRAI) ein interaktives Glossar mit derzeit rund 500 Begriffen und Definitionen rund um das Forschungsdatenmanagement.

Das Glossar ist als praktisches Nachschlagewerk für einzelne Wissenschaftlerinnen und Wissenschaftler oder Arbeitsgruppen gedacht, die sich um eine Verbesserung des Forschungsdatenmanagements kümmern. Darüber hinaus ist es ein Ort zur Diskussion und Weiterentwicklung der Begriffe und soll ein “lebendes Dokument” mit in der Community diskutierten und somit akzeptierten Definitionen bilden.

Jeder Begriff hat eine eindeutige ID und eine URL, die genutzt werden kann, um Begriffe mit ihren Definitionen zu verlinken und damit das Leseverständnis von Texten zu steigern.

Nachtrag (05.04.2023): Nachdem CASRAI 2020 seine Tätigkeit als Organisation eingestellte, hat CODATA die Verantwortung für das Glossar zum Forschungsdatenmanagement übernommen, welches nun als Research Data Management Terminology fortbesteht.

Handbuch Forschungsdatenmanagement

August 12th, 2015 | by

This entry is only available in Deutsch.

Das Handbuch Forschungsdatenmanagement bietet einen kompakten und disziplinübergreifenden Einstieg in den Themenkomplex. Geschrieben aus informationswissenschaftlicher und  anwendungsbezogener Perspektive bündelt es wichtige Aspekte des Forschungsdatenmanagements, wie beispielsweise die Langzeiterhaltung digitaler Forschungsdaten, Metadaten und Standards, Forschungsdaten-Repositorien oder die Datenanalyse und –visualisierung.

Konzipiert als Leitfaden für das Selbststudium unterstützt das Handbuch die persönliche Aus- und Weiterbildung und ist eine empfehlenswerte Lektüre für Wissenschaftlerinnen und Wissenschaftler, die Informationen über das Thema benötigen oder Ihren Umgang mit Forschungsdaten verbessern möchten.

Das Werk ist online verfügbar und als print-Version in der UB ausleibar.

Handbuch Forschungsdatenmanagement, herausgegeben von Stephan Büttner, Hans-Christoph Hobohm, Lars Müller. Bad Honnef : Bock + Herchen, 2011. ISBN 978-3-88347-283-6

Wiki forschungsdaten.org

August 6th, 2015 | by

This entry is only available in Deutsch.

Das Wiki forschungsdaten.org bündelt Kompetenzen zum Umgang mit Forschungsdaten und aggregiert alle Informationen zum Management mit digitalen Daten. Es bietet eine Plattform zur Vernetzung und zum Informationsaustausch für alle am Thema Interessierten, beispielsweise Forschenden und Infrastruktureinrichtungen wie Rechenzentren und Bibliotheken.

Interessant ist unter anderem die Beschreibung von fast 60 einschlägigen Projekten und Förderungsprogrammen in der Kategorie Projekte. Auch die Veranstaltungen der Research Data Alliance Deutschland (RDA-DE) und der DINI/nestor AG Forschungsdaten werden hier dokumentiert. Einen Überblick über alle Inhalte bietet die Startseite des Wikis.

Das Wiki wurde im Jahr 2013 von verschiedenen DFG-Projekten initiiert, die sich derzeit mit Forschungsdateninfrastrukturen befasst haben. Gehostet wird das Wiki vom Deutschen GeoForschungsZentrum (GFZ). Alle Inhalte sind aufgrund der offenen Lizenz CC BY 4.0  direkt nachnutzbar. Weitere Mitarbeit beim Anlegen und Ergänzen von Inhalten ist willkommen. Die Weiterentwicklung wird von einem Redaktionsteam gesteuert, das in monatlichen, virtuell stattfindenden Konferenzen tagt. Alle angemeldeten Personen können daran teilnehmen.

Falls Sie neue Inhalte haben und diese nicht selber eintragen möchten, wenden Sie sich einfach an das IT-ServiceDesk. Das FDM-Team freut sich auf Ihre Nachricht.

Martin Bobrow: “Funders must encourage scientists to share”

July 28th, 2015 | by

This entry is only available in Deutsch.

In der Juni Ausgabe der Zeitschrift Nature berichtet Martin Bobrow unter der Überschrift “Funders must encourage scientists to share” von den Ergebnissen der Expert Advisory Group on Data Access (EAGDA). Die Arbeitsgruppe wurde 2012 vom Wellcome Trust, dem Cancer Research UK, dem Economic and Social Research Council und dem Medical Research Council eingesetzt.

How can we make best use of the vast amounts of data on genomics, epidemiology and population-level health being collected by researchers? Maximizing the benefits depends on how well we as a scientific community share Information.

Den vollständigen Artikel können Sie innerhalb des RWTH Netzes direkt in Nature abrufen.
Den vollständigen Report der Arbeitsgruppe finden Sie auf den EAGDA Seiten des Welcome Trust.

Bobrow, M. (2015). Funders must encourage scientists to share. Nature, 522(129). doi:10.1038/522129a.

DINI/nestor AG Forschungsdaten: Workshop Langzeitarchivierung

July 22nd, 2015 | by

This entry is only available in Deutsch.

In ihrem dritten Workshop beschäftigte sich die DINI/nestor AG Forschungsdaten mit der Langzeitarchivierung von Forschungsdaten. Es kamen sowohl Infrastruktureinrichtungen als auch einzelne Universitäten/Projekte zu Wort. Die Zentralbibliothek Technik und Naturwissenschaften (TIB Hannover) und die Fachgesellschaft für Geistes- und Sozialwissenschaften (GESIS) berichteten über die aufwändigen Verfahren für eine Zertifizierung ihrer Repositorien. Die Unis Tübingen, Trier und Köln stellten projektbasierte bzw. institutionelle Ansätze vor, die sich aus konkreten größeren Forschungsvorhaben (z.B. SFBs) entwickelt haben.

Der Vortrag von Anna Sesartic von der ETH Zürich machte anhand des Bereichs Systemökologie sehr anschaulich deutlich, vor welchem Herausforderungen die Langzeitarchivierung von Forschungsdaten steht, selbst wenn entsprechende Vorkehrungen getroffen werden. Ihre treffende Schlussbemerkung:

Die beste Langzeitarchivierung für Files ist dann gewährleistet, wenn mit ihnen gearbeitet wird.

Der Workshop hat dokumentiert, dass es Aufgabe der Infrastruktureinrichtungen ist, sich sinnvoll, einrichtungsübergreifend zu vernetzen, um schnell verlässliche Strukturen aufzubauen, dass aber den Forschenden eine zentrale Rolle bei der Auswahl und der Sicherstellung der langfristigen Nutzbarkeit ihrer Daten zukommt.

Die Folien zu den Vorträgen sowie ein kompaktes Protokoll sind über die Webseite Webseite des Workshops verfügbar.

2. RADAR Workshop: Prototyp des Research Data Repositoriums wurde vorgestellt

July 15th, 2015 | by

This entry is only available in Deutsch.

Am 23.06.2016 fand der 2. Workshop des DFG-Projektes RADAR – Research Data Repositorium in Frankfurt am Main statt, in dessen Rahmen der Prototyp zur Archivierung und Publikation digitaler Forschungsdaten vorgestellt und diskutiert wurde.

RADAR richtet sich an drei Zielgruppen, denen es seine Dienstleistung anbieten wird:

  1. einzelne Forschende/Projekte
  2. Institutionen/institutionelle Einrichtungen (z.B. Bibliotheken)
  3. Verlage

Dabei fokussiert RADAR den sogenannten “Long Tail“ an Forschungsdaten, der sich durch geringe Datenvolumina bei großer Heterogenität auszeichnet. Diese Abgrenzung ist wichtig, da angenommen wird, dass für „Big Data“ geeignete Infrastrukturen in Form von etablierten Datenzentren existieren, zu denen keine Konkurrenz aufgebaut werden soll. RADAR wird alle Datentypen (ausgenommen personenbezogene Daten) und alle Datenformate akzeptieren.

Der RADAR-Prototyp kann getestet werden. Der Weg zu einem Testzugang ist hier beschrieben. Die gezeigten Folien sind auf der RADAR-Webseite zum Download bereitgestellt.

Bericht zum Workshop Research Data Alliance – Deutschland (28.-29.05.2015, Karlsruhe)

June 18th, 2015 | by

This entry is only available in Deutsch.

Am 28. und 29. Mai 2015 veranstaltete die Research Data Alliance Deutschland (RDA-DE) in Kooperation mit DINI einen Workshop mit dem Thema „Aktuelle Resultate der Research Data Alliance (RDA) und deren zukünftige Bedeutung“.

Ziel war es, die Research Data Alliance (RDA) bekannter zu machen und die notwendigen Schritte zu identifizieren, damit aus RDA für den Forschungsalltag unmittelbar nutzbare Ergebnisse resultieren. So ist nach der Darstellung von Peter Wittenburg, einem der Initiatoren der Veranstaltung, zwar allgemein anerkannt, dass die aktuelle Praxis zum Umgang mit Forschungsdaten ineffektiv ist. Auch besteht weitgehend Einigkeit über die Trends und Herausforderungen (z.B. “information explosion”) sowie die grundlegenden Prinzipien, denen der Umgang mit Forschungsdaten folgen sollte (z.B. Notwendigkeit für persistent identifier). Es ist bis jetzt aber noch nicht gelungen, daraus Komponenten und Services abzuleiten, die von Wissenschaftlerinnen und Wissenschaftlern einfach in ihrem jeweiligen Arbeitskontext (“data fabric”) genutzt werden können. Problematisch ist auch, dass einzelne Dienste zwar bereits existieren, aber nicht ausreichend bekannt sind (z.B. EPIC oder Services, die in EUDAT entwickelt werden).

Im Workshop wurden die ersten Ergebnisse der RDA diskutiert und dann anhand von konkreten Datenprojekten (Folien sind im Programm verlinkt) aus verschiedenen Disziplinen mögliche Komponenten und Services diskutiert. Ein erstes Draft des Berichts zum Workshop zieht eine positive Bilanz, allerdings können passende Komponenten und Services nur entwickelt werden, wenn sie als Anforderungen formuliert werden. Daher ist die Teilnahme und Rückmeldung von Use Cases und Anforderungen sowie Kommentare zu möglichen Komponenten und Services wichtig. Hier kann sich jeder beteiligen!

Gerne unterstützt Sie das FDM-Team bei der Formulierung. Wenden Sie sich mit Ihrem Anliegen einfach an das IT-ServiceDesk.

Research Data Alliance (RDA)

May 27th, 2015 | by

This entry is only available in Deutsch.

Die Research Data Alliance (RDA) ist eine internationale Initiative, in der über 2.500 Mitglieder aus 92 Ländern an den Rahmenbedingungen einer optimierten internationalen Forschungsdateninfrastruktur arbeiten. RDA wurde 2013 in Göteborg gegründet und wird von der Europäischen Kommission, der US National Science Foundation, dem US National Institute of Standards and Technology und der australischen Regierung finanziert. Das langfristige Ziel ist es, den offenen Austausch von Forschungsdaten auch über Disziplingrenzen hinweg zu fördern.

The Research Data Alliance is building the social and technical bridges that enable open sharing of data.

In aktuell 58 thematischen Arbeits- und Interessengruppen arbeiten internationale Experten an der Entwicklung und Implementierung von entsprechenden Infrastrukturen, Policies und harmonisierten Standards, die zur Förderung des Austauschs und der Nachnutzung von Forschungsdaten beitragen. Die Ergebnisse werden in den halbjährlich stattfindenden Plenary Sitzungen diskutiert. Das nächste Plenary findet vom 23. bis 25. Sept 2015 in Paris statt.

Am 28. und 29. Mai 2015 veranstaltet die Research Data Alliance Deutschland (RDA-DE) in Kooperation mit der Deutsche Initiative für Netzwerkinformation e. V. (DINI e.V.) am Karlsruher Institut für Technologie (KIT) einen Workshop mit dem Thema „Aktuelle Resultate der Research Data Alliance (RDA) und deren zukünftige Bedeutung“.

Acht RDA Arbeitsgruppen haben bereits konkrete Ergebnisse erzielt und diese in einer Broschüre zusammengefasst. Die aktuelle Version im PDF-Format ist hier verfügbar. Das Dokument enthält Problemstellungen, Ziele und Lösungsansätze folgender RDA-Arbeitsgruppen:

  • Data Foundation and Terminology Working Group
  • Data Type Registries Working Group
  • PID* Information Types Working Group
  • Practical Policy Working Group
  • Scalable Dynamic Data Citation Working Group
  • Data Description Registry Interoperability Working Group
  • Metadata Standards Directory Working Group
  • Wheat Data Interoperability Working Group

*Persistent Identifier (PID), beispielsweise Digital Object Identifier (DOI), sind wichtig für die Zitierfähigkeit eines Datensatzes. Eine ausführliche Beschreibung finden Sie auf der Webseite der UB.