Kategorie: ‘Allgemein’
HPC Cluster: Linux Kernel Upgrade
The Linux Kernel on the CLAIX18 compute nodes is being upgraded to kernel version 4.18.0-477.21.1. To maximise the availability of the compute cluster, the mandatory reboot of the nodes is scheduled as a reboot job, thus allowing all already submitted and running jobs for completion before the upgrade takes place.
Please note that the reboot is prioritised over other jobs, and some nodes may be temporarily unavailable after the reboot.
Best regards,
Your HPC-Team@RWTH
You can track any disruptions or security advisories that may occur due to the aforementioned change in the Email category on our status reporting portal.
Change in SSH Configuration: Depreciation of Insecure Methods, Addition of New Methods
As the result of a recent security evaluation, we have decided to disable several methods in key exchange, message authentication codes and encryption ciphers classified insecure/weak which obsoletes the following methods and method groups as listed below. In general, we have disabled SHA-1-based methods since SHA-1 is broken since early 2017 (cf. Stevens et al.: „The first collision for Full SHA-1“).
We kindly ask you to update your client configuration accordingly since these methods cannot be used anymore to access the RWTH Aachen HPC Cluster until further notice: Weiterlesen »
Resource limits on HPC dialog systems changed
We have reduced the per-user-resource limits for main memory on the HPC dialog systems (login18-1.hpc.itc.rwth-aachen.de etc.). A single user can now only use about 25% of the available main memory, i.e. 96GB for most of our servers. On login18-x-1 and login18-x-2, as before, only 16 GB are available to each user.
OS Upgrade to Rocky 8.8
Dear users of the cluster,
on
** July 17, 2023 from 7:00 a.m. to 5:00 p.m. **
there will be a maintenance where we will update the current operating system Rocky Linux 8.7 to Rocky Linux 8.8. The front ends will also be updated, so you will not be able to log into the cluster or access your data.
However, there is an exception to this. The MFA test engine login18-4 will remain accessible, but you will only be able to log in there with a second factor [1]. Temporarily, however, $HPCWORK will also be unreachable here, as the Lustre file system is also undergoing maintenance.
We do not expect that you will have to recompile your software or change your job scripts. So your jobs should start normally after the end of the maintenance.
With best regards
Your HPC Team @ RWTH
CLAIX-2016 EOL
CLAIX-2016 already reached its end of life for a while. For convenience reasons we still operate the following systems:
- CLAIX-2016 dialog („login“) nodes:
login.hpc.itc.rwth-aachen.de
login-g.hpc.itc.rwth-aachen.de
login-t.hpc.itc.rwth-aachen.de - Data Transfer node:
copy.hpc.itc.rwth-aachen.de - CLAIX-2016-SMP nodes (144 cores, 2TB main memory):
lns02.hpc.itc.rwth-aachen.de
lns03.hpc.itc.rwth-aachen.de
We will switch off all remaining nodes on **July, 10th 2013**. Please use CLAIX-2018 login / transfer nodes in future.
Today, at 13 o’clock, we have powered off the above mentioned systems.
New Terms of Use and Data Privacy Agreement
We updated our data privacy agreement and the terms of use for the service „RWTH High Performance Computing“:
One major change is that we have two separate data privacy agreements now:
- One for the RWTH Compute Cluster and the RWTH JARDS online portal.
- One for the NHR JARDS online portal.
This change is necessary, because the NHR JARDS online portal will be used by all national HPC centers (NHR) in future.
We believe all documents are in the interest of our users and enable a fair, productive and secure usage of our HPC resources. Thus, your consent is assumed. Otherwise, you can delete your HPC account at any time:
The changes come into force at June 1st, 2023.
If you have any questions or problems, the colleagues at the IT-ServiceDesk (servicedesk@itc.rwth-aachen.de) will be happy to help you.
You can track any disruptions or security advisories that may occur due to the aforementioned change in the RWTH-HPC category on our status reporting portal.
EOL CentOS Software Environment
As announced, the old CentOS software stack will reach its end of life on April, 30th. Beginning with May 2nd, this means the following:
- No submission to CentOS nodes will be possible anymore.
- All CLAIX-2018 login / dialog nodes will be migrated to Rocky 8 Linux, lmod and the new software stack.
- Jobs submitted to CentOS nodes before May 1st will be scheduled to the remaining CentOS batch nodes on a best-effort basis, without guarantee for start or completion within the remaining lifetime of those nodes. We strongly recommend to submit all new jobs to the new Rocky 8 environment as of now.
Please find the overview of changes with Rocky Linux 8 here.
You can track any disruptions or security advisories that may occur due to the aforementioned change in the RWTH-HPC category on our status reporting portal.
EOL login2.hpc.itc.RWTH-Aachen.de
Aufgrund eines Hardwareschadens ist das Dialogsystem
ab sofort nicht mehr nutzbar. Bitte nutzen Sie zukünftig die Dialogsysteme von CLAIX18 (Login Nodes).
Etwaige auftretende Störungen oder Sicherheitshinweise aufgrund des genannten Changes in der Kategorie RWTH-HPC könnt ihr auf unseren Statusmeldungsportal verfolgen.
Erhöhung der maximalen Rechenleistung RWTH-S
Ab dem 18. April 2023 wird das maximale jährliche CPU-Kontingent für RWTH Small (RWTH-S) Projekte von 0,24 Mio. Core-h auf 0,36 Mio. Core-h erhöht. Weitere Informationen zum Antragsverfahren finden Sie auf unserer Website.
Etwaige auftretende Störungen oder Sicherheitshinweise aufgrund des genannten Changes in der Kategorie RWTH-HPC könnt ihr auf unseren Statusmeldungsportal verfolgen.
Neue Softwareumgebung und neues Betriebssystem für CLAIX
Da CentOS 7, das Linux-Betriebssystem von CLAIX, veraltet ist und CentOS Linux 8 das End of Life (EOL) erreicht hat, müssen wir auf eine neue Linux-Distribution umsteigen. Wir haben uns für Rocky Linux 8.7 entschieden, das auch mit Red Hat Enterprise kompatibel ist.
Hand in Hand mit dieser Umstellung haben wir auch die Umstellung auf eine neue Softwareumgebung auf der Grundlage von EasyBuild und Lmod vorbereitet. Diese Tools sind auch in anderen HPC-Zentren weit verbreitet. Wir erwarten, dass sie die Benutzerfreundlichkeit und die Wartbarkeit aus der Sicht des Administrators verbessern werden.
Für euch als Nutzende bedeuten beide Änderungen jedoch, dass ihr
(1.) lernt, wie man das neue Modulsystem benutzt (z.B. geänderte Namen der Module, Toolchains, etc.) und
(2.) eure Software neu kompilieren und
(3.) eure Batch-Skripte überarbeiten und möglicherweise entsprechend ändern.
Da wir wissen, dass ihr eure Zeit braucht, um euch auf diese Änderungen vorzubereiten, werden wir für eine Übergangszeit von ca. 7 Wochen bis zum 30. April 2023 parallel Support für die alte (CentOS 7) und die neue (Rocky Linux 8) Umgebung anbieten. Während dieses Zeitraums werden immer mehr Rechenknoten auf die neue Umgebung migriert. Folglich können sich die Wartezeiten für Aufträge, die in der alten Umgebung ausgeführt werden sollen, mit der Zeit verlängern.
Wie kann man vorgehen?
Während einer Wartung am 8. März 2023 wurden die folgenden Login-Knoten in die neue Umgebung migriert:
login18-2.hpc.itc.rwth-aachen.de
login18-3.hpc.itc.rwth-aachen.de
login18-x-2.hpc.itc.rwth-aachen.de
login18-g-2.hpc.itc.rwth-aachen.de
copy18-2.hpc.itc.rwth-aachen.de
Aufträge, die von diesen Login-Knoten aus übermittelt werden, werden automatisch an Rechenknoten übermittelt, auf denen Rocky 8 und die neue Modulumgebung laufen. Alle Batch-Jobs, die von nicht migrierten Login-Nodes (d.h. nicht in der obigen Liste) eingereicht werden, werden in der alten Umgebung geplant.
Ihr könnt diese Anmeldeknoten verwenden, um eure neuen Workflows zu testen, Änderungen vorzunehmen und sich mit dem neuen Software-Stack vertraut zu machen. Ein Beispiel für das einfache Auffinden von Software mit „module spider“ im neuen Modulsystem findet ihr hier.
Bitte beachtet: Wenn ihr eine grafische Remote-Desktop-Sitzung nutzen möchtet, stellt sicher, dass ihr FastX 3 (neuere Version) verwendet.
Einen Überblick über die Änderungen bei der Umstellung und einen separaten Zweig über das neue Modulsystem (inklusive Beispielskripte für verschiedene Softwarepakete) findet ihr hier.
Etwaige auftretende Störungen oder Sicherheitshinweise aufgrund des genannten Changes in der Kategorie RWTH-HPC könnt ihr auf unseren Statusmeldungsportal verfolgen.