Hard- und softwaretechnische Änderungen am Vektorrechner NEC SX4
Peter Berger
Anfang August 1997 wurden umfangreiche hard- und softwaretechnische Änderungen am Applikationsserver für Lineare Algebra (cobra.zserv) vorgenommen. Entsprechend dem Vertrag mit der Firma DATAMED/NEC wurde der Ausbau des Hauptspeichers auf insgesamt 4 GByte SDRAM durchgeführt. Die ursprünglich vorgesehene Alternative zu diesem Umbau, die Installation von 2 GByte SSRAM und 2 GByte DSRAM als Erweiterungsspeicher wurde nicht realisiert, da mit einem Shared Memorysystem mit insgesamt 4 GByte bei dem gegebenen Jobprofil eine bessere Systemauslastung erreicht werden kann. Als Ausgleich der etwas geringeren Memory-Zugriffsgeschwindigkeit (60 ns Module, jedoch 1024-fach interleaved) ist geplant, im Dezember dieses Jahres einen Austausch der CPUs vorzunehmen, die über eine Peak-Performance von 2 GFLOPS pro Prozessor verfügen (8 ns Zykluszeit).
Gleichzeitig mit dem Hardwareumbau wurde ein Systemupgrade von R6.2 auf R7.1 Rev1 durchgeführt. Damit wurden auch neue Compiler für Fortran und C installiert.
Systemtechnisch ergeben sich durch diesen Umbau folgende Änderungen:
Durch die signifikante Vergrößerung
des Hauptspeichers besteht die Möglichkeit, wesentlich größere
Jobs mit höheren Hauptspeicheranforderungen zu rechnen. Nach den Erfahrungen
der letzten Monate und nach einer intensiven Diskussion mit den Benutzern
wurden folgende neue Queues eingerichtet:
Queue | sec | |
PRx-xlarge | 100.000 | 1500 |
PRx-large | 100.000 | 800 |
PRx-medium | 100.000 | 300 |
PRx-small | 100.000 | 128 |
Weiters wurde das NQS so parametrisiert, daß ein Swappen der Batchjobs der Queues xlarge und large verhindert wird.
Durch die Bildung von Queue-Komplexen und der Vergabe entsprechender Run-Limits kann eine Steuerung durchgeführt werden. Diese Run-Limits müssen jedoch dynamisch an die jeweilige Anzahl und die Anforderungen der Projekte angeglichen werden. Die Einrichtung dieser Queues erfolgt entsprechend den Anforderungen für das Projekt und wird mit dem Projektleiter abgestimmt.
Am Submit wurden keine Änderungen durchgeführt; abhängig von der angegebenen Memorygröße und dem Usernamen wird der Batchjob in die „richtige“ Queue eingereiht. Die Abbildung zeigt beispielhaft die Queues und die Komplexe (mit den Run-Limits) für drei Projekte.
Das globale job-run-limit (wieviele Batchjobs können max. gleichzeitig laufen) wurde auf 6 gesetzt, das globale submit-limit für User ist auf 3 gesetzt.