Applikationsserver Lineare Algebra

Der neue Höchstleistungs-Vektorrechner NEC SX-4

Peter Berger

Mit der EU-weiten Ausschreibung eines Applikationservers "Lineare Algebra" (LA-Server), die am 3. Juli 1996 veröffentlicht wurde, wurde in konsequenter Weise das Applikationsserver-Konzept des EDV-Zentrums weitergeführt. Ziel dieser Ausschreibung war die Beschaffung eines Systems mit hoher Einzelprozessorleistung, auf dem sich komplexe Problemstellungen (z. B. aus dem Bereich der Linearen Algebra) optimal lösen lassen.

Als maximaler Finanzrahmen standen öS 7.400.000.- (Kaufpreis inkl. MWSt.) zur Verfügung. Obwohl die Ausschreibung von 16 Firmen abgeholt wurde, hinterlegten bei der Anbotseröffnung am 27. August nur 2 Firmen gültige Angebote. Die Firma SNI bot ein System VPP300 (mit 2 Prozessoren), die Firma Datamed ein System NEC SX-4 (ebenfalls mit 2 Prozessoren) an.

Am 13. September 1996 wurde nach einer intensiven Evaluierungsphase der Zuschlag der Firma Datamed für die Lieferung eines Systems NEC SX-4 B/2 mit 2 Prozessoren, 2 GByte Hauptspeicher (SSRAM), 1 GByte Erweiterungsspeicher (Synchrones DRAM) und 32 GByte Plattenspeicher erteilt.

Die Lieferung erfolgt spätestens Ende November 1996.

Die Architektur des Vektorrechners NEC SX-4

Das System SX-4 von NEC ist ein Vektorrechner modernster Bauart. Die Prozessoren sind in CMOS-Technologie ausgeführt, die Zykluszeit beträgt bei den Modellen SX-4B 8,8ns (112,5 MHz); daraus ergibt sich eine Spitzenleistung von 1,8 GFlops pro Vektor-Prozessor. Jede Prozessoreinheit verfügt über einen Skalarprozessor (Superskalararchitektur), der mit der gleichen Zykluszeit arbeitet und eine Spitzenleistung von 250 MFlops hat.

Das Memorysubsystem zählt weltweit zu den schnellsten Shared Memory-Architekturen. Erreicht wird diese hohe Leistung durch den Einsatz von schnellen SSRAM Modulen (Synchronous Static RAM), eine Lese- oder Schreiboperation benötigt nur 16ns. Diese SSRAM-Module sind jene Bausteine, die heute in den modernsten RISC-Prozessoren als Cache-Memory eingesetzt werden. Die Anbindung der Prozessoren an den Hauptspeicher erfolgt mit einer Bandbreite von 16 GByte/sec pro CPU. An diesem Hauptspeicher ist ein Erweiterungsspeicher in SDRAM Technologie (Synchronous Dynamic RAM) angeschlossen, der als Filesystemcache oder für Programmdaten genutzt werden kann.

Die Anbindung der Peripherie erfolgt über I/O-Prozessoren, an denen I/O-Multiplexer, HIPPI- und SCSI-Controller angeschlossen werden können.

Das Betriebssystem (SUPER-UX) ist ein UNIX System V mit BSD-Erweiterungen, konform zum POSIX-Standard. Als Batchsystem steht NQS mit einer Vielzahl von Funktionen, Debugger-Software und Performance- und Analysetools zur Verfügung. Compiler für FORTRAN 77/90, HPF und C/C++ sind vorhanden, alle diese Sprachen haben volle Unterstützung für automatische Vektorisierung und Parallelisierung. An Zahlenformaten werden IEEE, CRAY- und IBM Floating Point-Formate unterstützt.

Die Blockdiagramme zeigen die Systemkomponenten und die Struktur eines SX-4 Prozessors.

Das System NEC SX-4 B/2 am EDV-Zentrum der TU Wien

Hardware

2 Prozessoren (1,8 GFlops pro Prozessor)
2 GByte Hauptspeicher SSRAM
1 GByte Erweiterungsspeicher SDRAM
1 Input/Output Prozessor
2 SCSI-2 FWD Controller
16 GByte Plattenspeicher (System, Swap, Scratch ...)
16 GByte Massenspeicher, RAID 5, (User-Home)
1 CDROM Laufwerk
1 DLT Bandeinheit (20 Gbyte)
1 DAT (4mm)
1 Ethernet
1 FDDI-Interface SAS
1 ATM-Interface

Systemsoftware

SUPER-UX (UNIX SV mit BSD-Erweiterungen)
NQS
Fortran 77 und 90 (vektorisierender und
parallelisierender Fortran-Compiler)
C und C++ (vektorisierender und
parallelisierender C-Compiler)
X11 R6
OSF/DCE
NSF 2 und 3

Anwendersoftware

Es stehen für diese Architektur optimierte Unterprogramme in den Bibliotheken (z.B. BLAS, LINPACK, NAG) sowie in einer MATHLIB zur Verfügung.

Installation

Die Installation ist für Ende November 1996 geplant, wir hoffen, Mitte Dezember einen Testbetrieb aufnehmen zu können.

Mit dem Kauf dieses Systems verfügt das EDV-Zentrum der TU Wien über einen Höchstleistungsrechner modernster Bauart, der international im absoluten Spitzenfeld einzureihen ist. Es sei angemerkt, daß dieses System bei den 1000 x 1000 LINPACK-Vergleichszahlen (siehe Jack Dongarra, LINPACK Benchmark) mit 3,2 GFlops unter den ersten 20 gereiht ist.

Für weitere Fragen und Auskünfte stehe ich Ihnen gerne zur Verfügung (Kl. 5815 oder berger@edvz.tuwien.ac.at). Aktuelle Informationen über den Installationsverlauf werden wir laufend bekanntgeben.


Zum Inhaltsverzeichnis, Pipeline 20, Oktober 1996