Kategorie: ‘HPCnews’
Das zentrenunabhängige HPC Wiki im Gauß-Allianz Infobrief

Quelle: Eigene Darstellung
Der Infobrief der Gauß-Allianz berichtet in der April/Mail-Ausgabe 2019 explizit vom HPC Wiki. Doch was macht diese Anwenderdokumentation so besonders?
Beim HPC Wiki handelt es sich um ein Anleitungsportal, das im Rahmen des DFG-Projektes ProPE gewachsen ist und nun auf eigenen Füßen steht. Seit Anfang des Jahres ist das zentrenunbhängige HPC Wiki im Produktivbetrieb und hilft Nutzenden weltweit mit Anleitungen auf englischer Sprache zum Thema High Performance Computing (HPC). Es beinhaltet dabei sowohl die spezifischen Informationen der Rechenezentren (site specifics) als auch generelle Informationen zum High Performance Computing (general information).
CLAIX-2018 – schnellster Hochleistungsrechner an einer deutschen Universität!
Die zweite Ausbaustufe des Clusters Aix-la-Chapelle – kurz CLAIX-2018 – ist abgeschlossen! Damit freuen wir uns auch bekanntzugeben, dass der neue Hochleistungsrechner Anfang Februar 2019 in Betrieb genommen werden kann.
CLAIX-2018 ist der neue Hochleistungsrechner an der RWTH Aachen University, der den Hochleistungsrechenbetrieb um eine außerordentliche Bandbreite an Features ergänzt. Darunter zeichnet er sich vor allem auch in puncto Nachhaltigkeit und Energieeffizienz aus.

Quelle: Eigene Darstellung
Die Server des CLAIX-2018 werden nun mit Wasser gekühlt und das mit Hilfe von Sidecoolern. Auf diese Weise wird eine umweltfreundlichere Kühltechnik ermöglicht, die den Bedarf an Luftkühlung im Serverraum um 90 Prozent reduziert. Auch wird bei der Kühllösung der Systeme auf eine nachhaltigere Variante gesetzt, die eine Wasservorlauftemperatur von bis zu 30 Grad Celsius erlaubt.

Speicher des Claix-2018.
Quelle: Eigene Darstellung
Mit einer umweltfreundlichen Kühltechnik gelingt es, dass der CLAIX-2018 nicht nur unter ökologischen Aspekten eine Innovation darstellt, sondern vor allem auch aus der technischen Perspektive ein echter Superstar unter den Supercomputern ist: Er beheimatet 1.032 MPI-Rechenknoten sowie 48 NVIDIA-GPU-Accelerators, ausgestattet mit jeweils zwei Intel Xeon Platinum 8160-CPUs. Diese Knoten unterstützen die Beschleunigung speziell optimierter Anwendungen und Rechenoperationen. Hochleistung ist hier Name des Programms, durch und durch.
Alle HPC-Systeme von CLAIX-2018 nutzen zusätzlich das HPC interconnect Intel Omni-Path 100G-Netzwerk. Mit CLAIX 2018 wird auch ein komplett neues paralleles HPC-Filesystem auf der Basis des Lustre-Systems in Betrieb genommen. Konkret bedeutet dies, dass eine Kapazität von 10 Petabyte sowie eine Lese- und Schreibbandbreite von 150 Gigabyte pro Sekunde zur Verfügung steht.
Gemessen an den HPC-Ressourcen zählt die RWTH Aachen University somit zu den TOP 10 der deutschen Hochschullandschaft. Wir freuen uns über den Neuzugang in unserem Supercomputer-Kader und blicken mit Freude in die Zukunft.
Wir haben Ihr Interesse geweckt? Dann schauen Sie doch gerne hier weiter!
ProPE Performance Engineering: Überregionaler Support für HPC-Nutzer im Bereich Performance Engineering
—-English version below—-

Quelle: ProPE
Im Rahmen des DFG-Projektes ProPE (Prozessorientiertes Performance-Engineering) gilt es eine Serviceinfrastruktur zu entwickeln, die einen effizienten Gebrauch von Ressourcen im Bereich High Computing standortübergreifend ermöglicht. Dabei stehen die Nutzenden der kooperierenden Rechenzentren, dem ZIH der Technischen Universität Dresden, dem RRZE der Friedrich-Alexander-Universität Erlangen/Nürnberg und dem IT Center der RWTH im Vordergrund, die von den Kompetenzen und Beratungsschwerpunkten aller Kooperationspartner profitieren. Weiterlesen »
ProPE Performance Engineering: Eine zentrumsübergreifende HPC-Dokumentation
— English version below —

Quelle: ProPE
In Vorbereitung auf das Nationale Hochleistungsrechnen (NHR) und die Digitale Hochschule NRW (DH-NRW) setzt das IT Center auf eine zentrumsübergreifende HPC-Dokumentation. Im Rahmen des wird die Dokumentation der HPC-Systeme nicht nur vereinheitlicht, sondern direkt zusammengeführt und anschließend sowohl gemeinsam gepflegt, als auch weiterentwickelt. Weiterlesen »
ProPE Performance Engineering: Performance Monitoring der HPC-Systeme

Quelle: ProPE
Das Jahr neigt sich dem Ende und wir möchten Sie mit einer Blog-Serie durch den Advent begleiten. Im Rahmen des Projektes ProPE, gefördert durch die Deutsche Forschungsgesellschaft, möchten wir Ihnen Einblicke in die Welt des Performance Engineerings gewähren. Jeden Freitag bis Weihnachten stellen wir Ihnen spannende Beiträge aus den Bereichen Performance Monitoring, Shared Knowledgebase und der standortübergreifenden Supportstruktur vor, die von dem ProPE-Projektteam der RWTH Aachen University zur Verfügung gestellt werden.
HPC Cluster: Wartungen vom 14.05. – 17.05.2018 und vom 23.05. – 26.05.2018

Quelle: Pixabay
In den folgenden Zeiträumen wird der Batchbetrieb des HPC Clusters eingestellt:
14.05., 7:00 Uhr – 17.05.2018, 10:00 Uhr
sowie
23.05., 7:00 Uhr – 26.05.2018, 18:00 Uhr
Grund dafür sind Umbaumaßnahmen an der Stromversorgung. Dabei handelt es sich um notwendige Arbeiten zur Vorbereitung für die Installation des neuen HPC Clusters Claix II.
Diese Schritte zur Vorbereitung der Infrastruktur des neuen Clusters ermöglichen eine Verbesserung der Energieeffizienz und eine Leistungserhöhung. Darüber hinaus werden so die Voraussetzungen für eine verbesserte Zuverlässigkeit und Verfügbarkeit des neuen HPC Clusters geschaffen.
Systemwartung des RWTH Compute Clusters

Quelle: Pixabay
Auch der RWTH Compute Cluster muss gewartet werden, daher wird am kommenden Mittwoch eine große Systemwartung durchgeführt. Diese ist von 08:00 – 14:00 Uhr angesetzt und beinhaltet Wartungsarbeiten an den Netzwerk-Switchen, ein Versionsupgrade der Lustre-Server (HPCWORK) und der LSF-Software (Diese Software ist für Abarbeitung der Batch-Jobs verantwortlich).
Während des Wartungsfensters können Sie sich auf den Frontends einloggen und auch auf die Verzeichnisse $HOME und $WORK zugreifen. Das Verzeichnis „$HPCWORK“ steht während der Wartung nicht zur Verfügung. Zudem wird es während der Wartung nicht möglich sein, Jobs abzuschicken.
Weitere Informationen erhalten Sie auf unserer Störungsmeldungsseite.
Wir danken Ihnen für Ihr Verständnis.
Einladung zur Informationsveranstaltung: Abschaltung des Windows HPC-Batchbetriebs

Quelle: Eigene Darstellung
Nach 10 Jahren Hochleistungsrechnen auf dem Betriebssystem Windows wird der Batchbetrieb des Windows HPC-Clusters des IT Centers zum Jahresende (31.12.2015) eingestellt. Diese Maßnahme ist aufgrund der aktuellen Entwicklungen und aus betrieblichen Gründen notwendig.
Der Betrieb der Frontends des Windows-HPC-Clusters ist hiervon vorerst nicht betroffen.
Das Team der High Performance Computing Gruppe lädt daher herzlich am Mittwoch, den 28. Oktober 2015 zu einer Informationsveranstaltung ein, bei der Sie einen Überblick und Antworten auf folgende Fragen erhalten:
- Wieso ist die Abschaltung des WinHPC Batchbetriebs notwendig geworden?
- Wie sehen Nutzungsalternativen aus?
- Und wie geht es mit dem Frontend Betrieb weiter?
Aber auch für weitere Fragen und die Darstellung Ihrer Anforderungen an ein Batchbetrieb bleibt genügend Raum.
Interesse? Dann registrieren Sie sich auf der entsprechenden Webseite für die Teilnahme an der Veranstaltung.
Hier geht es lang.


