Hard- und softwaretechnische Änderungen am Vektorrechner NEC SX4

Peter Berger

Anfang August 1997 wurden umfangreiche hard- und softwaretechnische Änderungen am Applikationsserver für Lineare Algebra (cobra.zserv) vorgenommen. Entsprechend dem Vertrag mit der Firma DATAMED/NEC wurde der Ausbau des Hauptspeichers auf insgesamt 4 GByte SDRAM durchgeführt. Die ursprünglich vorgesehene Alternative zu diesem Umbau, die Installation von 2 GByte SSRAM und 2 GByte DSRAM als Erweiterungsspeicher wurde nicht realisiert, da mit einem Shared Memorysystem mit insgesamt 4 GByte bei dem gegebenen Jobprofil eine bessere Systemauslastung erreicht werden kann. Als Ausgleich der etwas geringeren Memory-Zugriffsgeschwindigkeit (60 ns Module, jedoch 1024-fach interleaved) ist geplant, im Dezember dieses Jahres einen Austausch der CPUs vorzunehmen, die über eine Peak-Performance von 2 GFLOPS pro Prozessor verfügen (8 ns Zykluszeit).

Gleichzeitig mit dem Hardwareumbau wurde ein Systemupgrade von R6.2 auf R7.1 Rev1 durchgeführt. Damit wurden auch neue Compiler für Fortran und C installiert.

Systemtechnisch ergeben sich durch diesen Umbau folgende Änderungen:

Änderungen im NQS-Batchsystem

Durch die signifikante Vergrößerung des Hauptspeichers besteht die Möglichkeit, wesentlich größere Jobs mit höheren Hauptspeicheranforderungen zu rechnen. Nach den Erfahrungen der letzten Monate und nach einer intensiven Diskussion mit den Benutzern wurden folgende neue Queues eingerichtet:

Queue sec (MByte, max.)
PRx-xlarge 100.000 1500
PRx-large 100.000 800
PRx-medium 100.000 300
PRx-small 100.000 128

Weiters wurde das NQS so parametrisiert, daß ein Swappen der Batchjobs der Queues xlarge und large verhindert wird.

Durch die Bildung von Queue-Komplexen und der Vergabe entsprechender Run-Limits kann eine Steuerung durchgeführt werden. Diese Run-Limits müssen jedoch dynamisch an die jeweilige Anzahl und die Anforderungen der Projekte angeglichen werden. Die Einrichtung dieser Queues erfolgt entsprechend den Anforderungen für das Projekt und wird mit dem Projektleiter abgestimmt.

Am Submit wurden keine Änderungen durchgeführt; abhängig von der angegebenen Memorygröße und dem Usernamen wird der Batchjob in die „richtige“ Queue eingereiht. Die Abbildung zeigt beispielhaft die Queues und die Komplexe (mit den Run-Limits) für drei Projekte.

Das globale job-run-limit (wieviele Batchjobs können max. gleichzeitig laufen) wurde auf 6 gesetzt, das globale submit-limit für User ist auf 3 gesetzt.


Zum Inhaltsverzeichnis, Pipeline 23, Oktober1997