|
Auf der 27. Hot-Chips-Konferenz
präsentierte das 2012 gegründete chinesische Start-up
Phytium seinen 64-Kern-ARMv8-Prozessor namens Mars, welcher speziell
für High Performance Computing (HPC) optimiert wurde. Dabei
bilden jeweils acht sogenannte Xiaomi-Kerne ein Panel. Sie teilen
sich zwei Directory Control Units (DCU), einen L2-Cache von 32 MByte
und eine Routing Cell für das interne Mesh. Für einen
Hop braucht das Mesh 3 Takte Latenz; für die Kommunikation
zwischen zwei Panels sind es im schlechtesten Fall 15, im Mittel
9 Takte.
16 DDR3-1600 Kanäle mit insgesamt 204 GByte/s und 128 MByte
L3-Cache stehen für alle acht Panels gemeinsam zur Verfügung.
Die I/O-Bandbreite beträgt 32 GByte/s und es werden zwei nicht
weiter spezifizierte PCIe-Kanäle unterstützt. Jeder Xiaomi
Kern fährt vier Out-of-Order-Pipelines mit bis zu 210 Befehlen
in flight und hat seinen eigenen jeweils 32 KByte großen
L1-Caches für Instruktionen und Daten. Mit Intels
Skylake-Kern zieht er mit diesem großen OoO-Fenster in etwa
gleich. Phytium gibt aber, anders als Intel, weitaus mehr Details
über die Funktionseinheiten und den internen Aufbau bekannt.
Vermutlich wird der Mars-Prozessor im 28-nm-Prozess von TSMC
gefertigt. Derzeit fahren die Kerne einen Takt von 2 GHz und kommen
bei Double Precision (vier DP-Flops pro Takt) so insgesamt auf 512
GFlops Spitzenleistung. Phytium gab für den im HPC-Bereich
üblichen Linpack-Benchmark noch keinen Wert an, er dürfte
aber bei ca. 90 Prozent der Spitzenleistung liegen. Stream-Triad
kommt auf bis zu 85 GByte/s Speicherbandbreite.
Gemessen mit SPECint_2006base (19,2) und SPECfp_2006base (17,8)
ohne Autoparallelisierung, liegt die Einzelleistung eines Kerns
bei Single Thread nur etwa bei einem Drittel aktueller Intel Haswell-Prozessoren.
Jedoch skaliert der Prozessor gut und kommt bei 64 Kernen dann auf
672 SPECint_rate2006_base und 585 SPECfp_rate2006_base. Ein System
mit zweimal Xeon E5 2697v3 mit 56 logischen Kernen liegt, zum Vergleich,
bei 1120 respektive 857. Allerdings müssen die Werte in Relation
zur Energieaufnahme gesehen werden. Phytium
hat 120 W TDP für den Mars spezifiziert, die beiden erwähnten
Xeon-Prozessoren kommen zusammen auf 260 W TDP.
(mt, hannover)
(siehe auch heise-News-Ticker:)
Hannover · EDV-Beratung ·
Linux · Novell · Microsoft · Seminar ·
IT-Consult · Netzwerk · LPIC · CLE
|