Kategorien
Seiten
-

IT Center Blog

aiXcelerate 2021 – I/O and Machine Learning im Fokus

20. Dezember 2021 | von

Quelle: Eigene Darstellung

aiXcelerate ist ein jährlicher Tuning-Workshop für HPC-Anwender*innen. Er umfasst Vorträge, die für jedermann zugänglich sind, und praktische Teile, in denen angemeldete Gruppen die erlernten Konzepte auf ihre eigenen Codes anwenden. Jedes Jahr konzentrieren wir uns auf ein anderes aktuelles Thema. In diesem Jahr, vom 6. bis 9. Dezember, konzentrierte sich aiXcelerate auf die Leistungsoptimierung für I/O-intensive Arbeitslasten und Machine-Learning-Anwendungen. Aufgrund der anhaltenden Pandemie fand aiXcelerate in einem Online-Format statt. Die Präsentationen wurden live über Zoom gehalten und Fragen sowie Diskussionen wurden über einen speziellen Slack-Kanal geführt. Täglich kamen mehr als 20 Teilnehmer*innen.

I/O

Das I/O-Verhalten wissenschaftlicher Simulationen zu verstehen und zu verbessern ist nicht trivial, da es nicht nur Kenntnisse über die Interna eines Simulationscodes, sondern auch über die Dateisysteme eines bestimmten HPC-Systems erfordert. Der I/O-Teil umfasste daher ein breites Spektrum an Informationen, von verfügbaren Dateisystemen und deren Konfiguration und erwartetem Verhalten bis hin zu Details über die Verwendung verfügbarer I/O-Bibliotheken. Entsprechend breit gefächert war während des Workshops auch das vorhandene Wissen und die Interessen des Publikums zu I/O-Themen. Während der verschiedenen Präsentationen war das Publikum sehr engagiert und stellte sowohl über Zoom als auch über die Slack-Diskussionsräume spannende Fragen.

ML

Maschinelles Lernen (ML), Deep Learning (DL) und Künstliche Intelligenz (KI) werden für Forscher*innen aller Fachrichtungen immer wichtiger. Dieser Teil des Workshops konzentrierte sich darauf, den Nutzern des RWTH Compute Clusters die Werkzeuge an die Hand zu geben, die sie für die Ausführung und Optimierung ihres Codes und Workflows benötigen.

Anstatt tief in die theoretischen Hintergründe von ML und DL einzutauchen, wurden die Teilnehmenden mit praktischen Beispielen und Best Practices unter Verwendung gängiger Software-Frameworks wie scikit-learn, TensorFlow und PyTorch vertraut gemacht, die veranschaulichten, wie sie effizient auf CLAIX mit virtuellen Umgebungen oder Containern ausgeführt werden können und worauf dabei zu achten ist.

Dazu gehörte auch eine Fallstudie, in der gezeigt wurde, wie suboptimaler Code identifiziert und durch eine eingehende Leistungsanalyse behoben werden kann. Schließlich wurde dieser Teil durch praktische Übungen ergänzt, in denen gezeigt wurde, wie das Training und die Auswertung mit verteiltem maschinellem und Deep Learning über mehrere GPUs und Rechenknoten hinweg beschleunigt werden kann.

Bring-your-own (BYO) Code

Eine Besonderheit unserer aiXcelerate-Workshops ist der „BYO-Code“-Teil. Das bedeutet, dass HPC-Benutzer ihre eigenen Softwarecodes zum Workshop mitbringen können. Jede Gruppe arbeitet während des Workshops mit HPC-Expertinnen und Experten sowie engagierten Mentoren aus dem IT Center zusammen, um die Leistung des BYO-Codes auf dem RWTH Compute Cluster CLAIX zu untersuchen. Um an dieser Erfahrung teilzunehmen, mussten sich HPC-Anwender*innen explizit für BYO bewerben und spezifische Code-Details liefern. In diesem Jahr haben wir intensiv mit einer Reihe von Anwenderinnen und Anwendern zusammengearbeitet und ihnen dabei geholfen, ihren Code auf CLAIX zu implementieren, wobei wir uns auf das I/O- und ML-Verhalten konzentriert haben. Alle BYO-Teilnehmer*innen gaben ein sehr positives Feedback und stellten Verbesserungen bei ihren Rechenaufgaben fest.

 

Veranstaltung verpasst? Kein Problem!

Behalte unsere IT Center Events um Blick und verpasse kein Event mehr rund um HPC und dem IT Center.

 

Verantwortlich für die Inhalte dieses Beitrags ist Sandra Wienke.

Kommentare sind geschlossen.