Die International Supercomputing Conference (ISC) ist Europas führende Konferenz und Ausstellung für High Performance Computing, Networking und Storage. Nationale und internationale Ausstellende präsentieren dort ihre entsprechenden Produkte und Dienstleistungen.
Dieses Jahr konnte die Messe im eigentlichen Sinne aufgrund der besonderen Umstände nicht stattfinden. Natürlich hat sich das Team vom ISC da aber etwas überlegt – ein Digital Event. Ganze vier Tage, nämlich vom 22. bis zum 25. Juni 2020, konnten Foren, Focus Sessions, Research und Project Poster Sessions, sowie zahlreiche Workshops online abgerufen werden. Den virtuellen Teilnehmenden wurden so viele Neuheiten rund um High Performance Computing (HPC) präsentiert.
Auch dieses Jahr war das IT Center und das Institut für organische Chemie (IOC) mit von der Partie und wurde durch Christian Terboven, Tim Cramer, Nina Löseke, Franziska Schoenebeck (IOC), Jannis Klinkenberg, Sebastian Wellig (IOC) und Marc-Andre Hermanns sehr erfolgreich mit zwei Project Poster Sessions, HPC Kompetenznetzwerk von Nordrhein-Westfalen (HPC.NRW) und die automatisierte Generierung von Eingabedaten für machinelearningbasierte Vorhersagen der Ni(I)-Dimer-Bildung, vertreten.
Womit sich die Forschergruppen genau in ihren Projekten befassen, haben wir für Euch nachfolgend zusammengestellt:
Die Idee hinter dem HPC Kompetenznetzwerk NRW
Das Bundesland Nordrhein-Westfalen (NRW) verfügt über eine vielfältige HPC-Infrastruktur, welche Systeme aller Ebenen (Tier-0 bis Tier-3) über fast alle Universitäten und Bundesforschungseinrichtungen hinweg abdeckt.
HPC.NRW arbeitet am Aufbau und der Aufrechterhaltung eines HPC-Kompetenznetzwerks, das neben der reinen Hardware-Infrastruktur für Wissenschaftler und Wissenschaftlerinnen landesweit fundierte HPC-Beratungsleistungen, Schulungen, Tutorien und Workshops anbietet. Dies ermöglicht insbesondere jungen Fachwissenschaftlern, HPC-Ressourcen effizient zu nutzen und ihre Methodenkompetenz zu erweitern. Das Kompetenznetzwerk kombiniert die Expertise der größeren universitären Tier-2-Zentren mit denen der Ebene 3. Es bietet eine kompetente und breit gefächerte Anlauf- und Beratungsstelle sowohl für die HPC-Anwendenden als auch für die Betreibenden dieser Systeme.
Darüber hinaus führt die strukturierte Bereitstellung von HPC-Ressourcen und einer ähnlichen Softwareumgebung zu einer erhöhten beidseitigen Durchlässigkeit zwischen Tier-2- und Tier-3-Systemen und zu einer harmonisierten Nutzererfahrung über alle Zentren und die verschiedenen HPC-Plattformen in NRW hinweg. Zu den landesweiten Beratungsleistungen gehört die Unterstützung der User bei der Auswahl eines geeigneten Zentrums und der Rechenzeitnutzung. Das Kompetenznetz wird ein einheitliches und wissenschaftsgeleitetes Antrags- und Genehmigungsverfahren für Tier-2-Systeme etablieren. Darüber hinaus wird es die Qualität des Betriebs in Bezug auf Softwareausstattung, Monitoring, Reporting, Auslastung und Effizienzkontrolle fördern.
Warum wir die automatisierte Generierung von Eingabedaten für maschinenlernbasierte Vorhersagen der Ni(I)-Dimer-Bildung brauchen
Das Thema „HPC“ gewinnt für viele Wissenschaftler und Wissenschaftlerinnen immer mehr an Bedeutung und stellt einen wesentlichen Faktor für exzellent betriebene Forschung dar, so auch im Bereich der Chemie. Ni(I)-
Dimere z.B. sind nützlich für die selektive Synthese und katalysieren komplexe Reaktionen, weshalb eine große Nachfrage nach ähnlichen Katalysatoren besteht. Ein experimenteller Ansatz zum Testen von Kandidaten zur Bildung dieses spezifischen Katalysators ist zeitaufwendig und schwierig zu untersuchen. Deshalb wollen die Forscher der Schoenebeck-Gruppe am RWTH-Institut für Organische Chemie mit HPC-basierten Methoden daran forschen.
Bisher war der Workflow zur Erstellung von Daten, aus denen Machine-Learning-Merkmale (ML-Merkmale) extrahiert werden, nur teilweise implementiert und erforderte viele manuelle Eingriffe, was ihn anfällig für Fehler machte. Das behandelte Projekt konzentriert sich auf die Entwicklung eines vollautomatischen, Python-basierten Frameworks zur Erzeugung von ML-Input zur Identifizierung von Liganden, die neue, reaktive Ni(I)-Dimere bilden. Liganden sind Ionen/Moleküle, die an den di-nuklearen Nickelkern gebunden sind. Zudem ist dieses Framework auf den RWTH Compute Cluster zugeschnitten.
Das Framework passt den bisherigen Arbeitsablauf effizient an und schließt eine automatische Fehlererkennung mit ein. Auf diese Weise sind nur noch wenige Benutzereingriffe notwendig. Der ML-Datensatz wird ohne Experimente computergestützt durch Anwendung von rechenintensiven, parallelisierten DFT-Berechnungen auf eine Sammlung von Spezies generiert. Letztere bestehen jeweils aus Liganden und Nickel. DFT ist eine Methode der quantenmechanischen Modellierung, welche für jedes Molekül eine möglichst optimale Anordnung bestimmt.
Der Ansatz führt zu einem Eingabedatensatz, der groß genug ist, um innovative Erkenntnisse zur Identifizierung neuartiger, reaktiver Ni(I)-Dimere zu liefern. Dies ist mit rein experimentellen Daten schwierig zu erreichen, da diese oft in ihrer Größe begrenzt und durch Vorauswahl der ML-Merkmale verzerrt sind. Dieser Umstand stellt eine der größten Herausforderung von ML im Bereich der Chemie dar. Aktuell werden verschiedene ML-Algorithmen und ihre Wirksamkeit für diesen speziellen in diesem Kontext untersucht.
Unsere Eindrücke
Auch wenn die diesjährige ISC ganz anders als in den vergangenen Jahren war, war die Veranstaltung ein voller Erfolg. Wir hatten die Möglichkeit uns mit den anderen Kolleginnen und Kollegen auszutauschen, unsere Erfahrungen zu teilen und unsere beiden Project Poster vorzustellen. Wir freuen uns bereits auf die nächste ISC im kommenden Jahr!
Verantwortlich für die Inhalte dieses Beitrags sind Liza Schwarz, Tim Cramer und Nina Loeske.