Dieser Beitrag ist Teil unserer Reihe „Data Champions an der RWTH“. Data Champions sind Forschende oder Mitarbeitende, die sich im Bereich des Forschungsdatenmanagements (FDM) besonders hervorgetan haben und/ oder Erfahrungen vorweisen, die für Kolleginnen und Kollegen wegweisend sind oder als Orientierungshilfe dienen können.
Unsere erste Data Champion ist Prof. Dr. med. Carolin Victoria Schneider. Sie ist am Uniklinikum der RWTH tätig und wurde von academics zur Nachwuchswissenschaftlerin des Jahres 2023 gekürt. Wir haben mit Frau Schneider über ihren Bezug zum und ihr Interesse am Forschungsdatenmanagement gesprochen.
Frau Schneider, bitte stellen Sie sich kurz vor.
Mein Name ist Carolin Schneider, geboren am 14. Juni 1995 in Neuss. Meine schulische Laufbahn begann am Erzbischöflichen Gymnasium Marienberg in Neuss, wo ich im Juni 2013 mein Abitur absolvierte. Anschließend entschied ich mich für ein Medizinstudium an der RWTH Aachen, welches ich von September 2013 bis Dezember 2019 absolvierte. Während meines Studiums erhielt ich das Peter Scriba Promotionsstipendium, welches meine Promotion in Medizin förderte. Diese schloss ich von Februar 2016 bis Oktober 2020 an der RWTH Aachen ab. Im Anschluss an mein Studium zog es mich in die USA, wo ich von Dezember 2019 bis Juni 2022 einen Postdoc-Forschungsaufenthalt an der University of Pennsylvania absolvierte. Diese Zeit wurde durch das Walter-Benjamin-Stipendium der Deutschen Forschungsgemeinschaft gefördert. Diese Erfahrung hat nicht nur meine wissenschaftlichen Kenntnisse, sondern auch meine interkulturellen Kompetenzen erweitert.
Seit dem 1. Juli 2022 bin ich als Forschungsgruppenleiterin und Ärztin an der RWTH Aachen tätig. Diese Position ermöglicht es mir, sowohl in der klinischen Praxis als auch in der Forschung tätig zu sein, was mir sehr wichtig ist. Am 1. September 2023 habe ich die W1-Professur für Prävention und Genetik metabolischer Lebererkrankungen an der RWTH Aachen angetreten. Darüber hinaus bin ich seit dem 1. Dezember 2023 eine außerordentliche Professorin für Translationale Medizin und Humangenetik an der University of Pennsylvania in Philadelphia, USA. Diese transatlantische Rolle ermöglicht es mir, in zwei hochkarätigen akademischen Umfeldern Brücken zwischen Forschung und klinischer Anwendung zu schlagen und so zur Weiterentwicklung der medizinischen Wissenschaft beizutragen.
In welchem SFB arbeiten Sie? Was ist das genau?
Ich leite ein Projekt im SFB CRC 1382 mit dem Schwerpunkt Darm-Leber-Achse. Mein spezifisches Forschungsprojekt in diesem SFB konzentriert sich auf die komplexe Interaktion zwischen Darm und Leber, die stark durch das Darmmikrobiom beeinflusst wird. Dieses Gleichgewicht kann durch äußere und erbliche Einflüsse gestört werden und zu Krankheiten führen. Insbesondere die Ernährung wurde als wichtiger Regulator der Zusammensetzung des Mikrobioms identifiziert. Dennoch sind die mechanistischen Zusammenhänge zwischen Ernährung, Lebergesundheit und Mikrobiom noch wenig erforscht. Wir werden große Multi-Omics-Datensätze nutzen, um den Zusammenhang zwischen Ernährungsänderungen und der Entwicklung von Lebererkrankungen zu untersuchen, von denen wir vermuten, dass sie durch Veränderungen im Darmmikrobiom ausgelöst werden. Diese umfassenden computergestützten Studien werden wichtige Informationen über die Beziehung zwischen Nährstoffen, Mikrobiom, Lebererkrankungen und Stoffwechsel liefern und Daten für einen oder mehrere therapeutische Ansätze liefern, um die Darm-Leber-Achse als therapeutisches Instrument zu nutzen.
Was ist Ihr Bezug zum Thema FDM? Wann sind Sie zum ersten Mal damit in Berührung gekommen?
Mein Bezug zum Thema FDM entstand schon früh in meiner wissenschaftlichen Laufbahn, insbesondere, als ich begann, mich intensiver mit dem Einsatz von Data Science Methoden und KI in der medizinischen Forschung zu beschäftigen. Während meiner Promotion an der RWTH Aachen kam ich zum ersten Mal direkt damit in Berührung, als ich begann, große Datenmengen für meine Forschungsarbeit zu sammeln und zu analysieren. Diese Erfahrung vertiefte sich, während meines Postdoc-Aufenthalts an der University of Pennsylvania, wo ich Zugang zu noch größeren und vielfältigeren Datensätzen hatte.
Die Notwendigkeit, große und komplexe Datenmengen effizient zu verwalten, wurde schnell zu einem zentralen Aspekt meiner Arbeit. Dazu gehört das sorgfältige Sammeln, Aufbereiten und Analysieren von Daten aus unterschiedlichen Quellen. Dabei wurde mir bewusst, wie wichtig eine strukturierte und systematische Herangehensweise an diese Daten ist, um die Integrität der Forschung zu gewährleisten und reproduzierbare und valide Ergebnisse zu erzielen. Die interdisziplinäre Zusammenarbeit unterstrich die Bedeutung eines kohärenten Forschungsdatenmanagements für eine effiziente Kommunikation und Zusammenarbeit zwischen den Disziplinen. Ein wesentlicher Teil meines Engagements im Forschungsdatenmanagement ist auch die Berücksichtigung ethischer Überlegungen und datenschutzrechtlicher Bestimmungen. Der Schutz der Privatsphäre der Patienten und die Sicherheit ihrer Daten sind für mich von höchster Bedeutung. Dies erfordert eine ständige Auseinandersetzung mit ethischen Richtlinien und gesetzlichen Vorgaben, um sicherzustellen, dass alle Datenanalysen verantwortungsvoll und nach höchsten Standards durchgeführt werden.
Wieso ist es wichtig?
Forschungsdatenmanagement ist aus mehreren Gründen von entscheidender Bedeutung: Ein strukturiertes und effizientes FDM sichert zunächst die Qualität und Integrität der Forschungsergebnisse. Durch die systematische Sammlung, Speicherung und Analyse von Daten können Fehler reduziert und die Reproduzierbarkeit von Studienergebnissen verbessert werden. Dies ist besonders wichtig in einem Bereich, in dem Forschungsergebnisse direkte Auswirkungen auf klinische Entscheidungen und die Behandlung von Patienten haben können. Darüber hinaus ermöglicht ein gut organisiertes Forschungsdatenmanagement den effizienten Einsatz von Ressourcen. In der medizinischen Forschung fallen häufig große Datenmengen an, deren Sammlung und Analyse zeit- und kostenintensiv sein kann. Ein effektives Datenmanagement hilft, Doppelarbeit zu vermeiden, fördert die Wiederverwendung von Daten und unterstützt damit eine wirtschaftlichere Forschung. Ein weiterer wichtiger Aspekt ist die Förderung der Zusammenarbeit und des Wissensaustauschs innerhalb der wissenschaftlichen Gemeinschaft („Open Science“). Durch die Einhaltung von Standards im Forschungsdatenmanagement können Daten leichter ausgetauscht und zugänglich gemacht werden, was die Zusammenarbeit zwischen Forschenden verschiedener Disziplinen erleichtert. Dies ist besonders wichtig in der interdisziplinären Forschung, die für das Verständnis komplexer medizinischer Bedingungen und die Entwicklung neuer Therapien erforderlich ist. Schließlich spielen der Schutz der Privatsphäre und die Datensicherheit eine zentrale Rolle. In der medizinischen Forschung werden häufig sensible personenbezogene Daten erhoben. Ein verantwortungsvolles Forschungsdatenmanagement stellt sicher, dass diese Daten sicher aufbewahrt, verarbeitet und nur unter Einhaltung ethischer Richtlinien und gesetzlicher Vorschriften verwendet werden. Damit wird nicht nur die Privatsphäre von Patienten und Studienteilnehmern geschützt, sondern auch das Vertrauen der Öffentlichkeit in die medizinische Forschung erhalten.
Wie organisieren Sie Ihre Daten?
Die Organisation meiner Forschungsdaten nimmt einen zentralen Stellenwert in meiner wissenschaftlichen Arbeit ein und folgt einem methodisch durchdachten Ansatz, der sich von der Planung über die Speicherung bis hin zur Analyse und schließlich der möglichen Weitergabe der Daten erstreckt. Sobald die Daten gesammelt oder erworben sind, werden sie strukturiert und in Systemen gespeichert, die eine sichere und langfristige Aufbewahrung gewährleisten. Dabei kommen Datenbanksysteme zum Einsatz, die nicht nur eine effiziente Speicherung und Abfrage ermöglichen, sondern auch den Schutz der Daten vor unberechtigtem Zugriff gewährleisten. Der Datenanalyse geht eine sorgfältige Datenbereinigung voraus. Für die Analyse selbst verwende ich eine Vielzahl von Data Science Methoden, die je nach Forschungsfrage und Dateneigenschaften variieren können. Diese Methoden reichen von statistischen Analysen bis hin zu komplexen maschinellen Lernverfahren.
Welche Infrastruktur(-elemente) nutzen Sie?
Der SFB stellt uns sehr nützliche Werkzeuge zur Verfügung, die die Zusammenarbeit und die Datenanalyse auch innerhalb des SFB erleichtern. Eines dieser Tools ist der SharePoint, welchen wir für die Speicherung und den Austausch bestimmter Datensätze verwenden. SharePoint ermöglicht es unserem Team, effizient zusammenzuarbeiten und Dokumente und Informationen sicher auszutauschen. Für rechenintensive Aufgaben und die Verarbeitung großer Datenmengen nutzen wir den Cluster der RWTH Aachen. Diese Ressource ist besonders wertvoll für die Durchführung von Data Science Analysen und Simulationen, da sie uns die nötige Rechenleistung zur Verfügung stellt, um komplexe Berechnungen effizient durchzuführen, wenn dies mit der Datensicherheit des Datensatzes vereinbar ist. Die Bereitstellung unseres Codes erfolgt über GitHub. Um unsere Forschungsdaten zu organisieren und zu verwalten, verwenden wir, wo immer möglich, die FDM-Plattform Coscine. Coscine bietet eine umfassende Lösung für das Management von Forschungsdaten, die es uns ermöglicht, Daten systematisch zu katalogisieren, zu speichern und für die Zusammenarbeit innerhalb unseres Teams, innerhalb des SFB und mit anderen Partnern bereitzustellen.
Ein zentrales Element unseres Forschungsdatenmanagements ist aber der Datenmanagementplan, der eine detaillierte Beschreibung der Maßnahmen zur Datenspeicherung, -sicherung, -weitergabe und -archivierung enthält. Dieser Plan stellt sicher, dass alle Aspekte des Datenmanagements systematisch angegangen werden und die Einhaltung ethischer und datenschutzrechtlicher Bestimmungen gewährleistet ist.
Worauf müssen Sie bei der Handhabung der Daten achten?
Um diesen Herausforderungen verschiedener externer und interner Datensätze gerecht zu werden, setzen wir auf eine Kombination aus internen und externen Ressourcen sowie spezialisierten Tools, die sowohl die Sicherheit als auch die Effizienz unserer Forschungsprozesse gewährleisten. Zum Beispiel die Nutzung der Lifelines-Kohorte in unserem Projekt stellt besondere Anforderungen an das Datenmanagement, insbesondere an die Speicherung und Verarbeitung der Daten. Die Daten der Lifelines-Kohorte werden auf Servern der Kohorte gespeichert und können nicht heruntergeladen werden. Diese Situation zwingt uns auch, unsere Forschungsprozesse anzupassen. Wir müssen unsere Analysen sorgfältig planen und durchführen, da der Zugang zu den Daten auch zeitlich eingeschränkt ist. Dies erfordert eine genaue Planung unserer Forschungsaktivitäten und möglicherweise die Entwicklung neuer Datenanalysestrategien, die speziell auf die Infrastruktur der Lifelines-Kohorte zugeschnitten sind.
Werden Sie beim Datenmanagement unterstützt oder haben Sie Kontakt zu bzw. Erfahrungen mit Data Stewards?
Bei meiner Arbeit profitiere ich sehr von der Zusammenarbeit mit den Data Stewards. Sie helfen mir dabei, effektive Datenmanagementstrategien zu entwickeln, die den Anforderungen meiner spezifischen Forschungsprojekte entsprechen. Die Data Stewards unterstützen mich unter anderem bei der Strukturierung und Organisation meiner Daten, bei der Auswahl geeigneter Tools und Plattformen für die Datenspeicherung und -analyse sowie bei der Sicherstellung der Nachvollziehbarkeit, Zugänglichkeit und Interoperabilität aller Forschungsdaten.
Was wünschen Sie sich für die Zukunft? Welchen Ratschlag können Sie anderen geben?
Für die Zukunft wünsche ich mir, dass das Bewusstsein für die Bedeutung eines strukturierten und proaktiven Forschungsdatenmanagements in der wissenschaftlichen Gemeinschaft weiterwächst. Es ist wichtig, dass Forschende das Datenmanagement von Beginn ihrer Projekte an als integralen Bestandteil der Forschungsplanung betrachten. Ein gut durchdachter Datenmanagementplan ist nicht nur Voraussetzung für die Einhaltung von Förderrichtlinien und gesetzlichen Vorgaben, sondern bildet auch die Grundlage für qualitativ hochwertige, nachvollziehbare und nachnutzbare Forschungsergebnisse.
Mein zentraler Rat an andere Forscherinnen und Forscher, insbesondere an diejenigen, die am Anfang ihrer wissenschaftlichen Karriere stehen, lautet: Erstellt frühzeitig einen Datenmanagementplan! Ein solcher Plan hilft nicht nur, den Überblick über die gesammelten Daten zu behalten und deren Qualität zu sichern, sondern erleichtert auch die Zusammenarbeit im Team und mit externen Partnern.
Frau Schneider, vielen Dank für das interessante Interview! Wir wünschen Ihnen für Ihren weiteren Weg alles Gute und viel Erfolg.
Verantwortlich für die Inhalte dieses Beitrags sind Katharina Grünwald und Carolin Victoria Schneider.
Schreibe einen Kommentar
Du musst angemeldet sein, um einen Kommentar abzugeben.