Categories
Pages
-

Research Data – Latest News & Worth Knowing

Praxisorientierte Ratschläge zum Umgang mit Daten

September 9th, 2015 | by

This entry is only available in German.

Die Analyse von Daten ist eine Herausforderung, insbesondere wenn sich die Daten selbst oder die Auswertungskriterien laufend ändern, die eigenen Ressourcen schwanken, die Zeit knapp ist, nur eingeschränkte technische Werkzeuge zur Verfügung stehen, die Analysen aber trotzdem reproduzierbar und einfach erklärbar sein sollen.

Enda Ridge hat als “Data Scientist” in seinem Buch Guerrilla Analytics – A Practical Approach to Working with Data seine Best Practices für die Datenanalyse unter solchen Bedingungen in Form von sieben Prinzipien zusammengefasst und die Forschung als einen möglichen Anwendungsbereich benannt:

  1. Speicher ist billig, Verwirrung teuer.
  2. Projektstrukturen sollten einfach und visuell sein (keine umfangreich dokumentierten, projektspezifischen Regeln).
  3. Automatisierung mit Programmen ist dem manuellen Vorgehen in einer grafischen Bedienoberfläche vorzuziehen.
  4. Daten müssen zwischen Dateisystem, Analyseumgebung und dem abgelieferten Ergebnis identifzierbar und nachverfolgbar sein.
  5. Änderungen an Daten und Programmen sollten unter Versionskontrolle stehen.
  6. Kooperatives Wissen sollte in versionierten Builds gesammelt werden.
  7. Analyse-Code sollte von Anfang bis Ende ohne Unterbrechung ausführbar sein.

Auf seiner Webseite findet sich für jedes Prinzip eine kurze Begründung. Das Buch gibt darüber hinaus 90 praktische Tipps zusammen mit Beispielen und hat Eingang in das Programm unseres CDS-Seminars “Management von Forschungsdaten” (nächster Termin, Freitag 30.10.2015) gefunden.

Leave a Reply