Prof. Dr. G. Hellberg EDV Beratung und Softwareengineering seit 1984
Mailadresse fuer Kontaktaufnahme
NewsNews
 
Die Hellberg EDV Beratung ist SuSE Business Partner
 
Professor Hellberg ist Certified Novell InstructorDie Hellberg EDV Beratung ist Novell Business Partner
 
Die Hellberg EDV Beratung ist Microsoft Partner
 
GDATA Software
 
News

Auf der 27. Hot-Chips-Konferenz präsentierte das 2012 gegründete chinesische Start-up Phytium seinen 64-Kern-ARMv8-Prozessor namens Mars, welcher speziell für High Performance Computing (HPC) optimiert wurde. Dabei bilden jeweils acht sogenannte Xiaomi-Kerne ein Panel. Sie teilen sich zwei Directory Control Units (DCU), einen L2-Cache von 32 MByte und eine Routing Cell für das interne Mesh. Für einen Hop braucht das Mesh 3 Takte Latenz; für die Kommunikation zwischen zwei Panels sind es im schlechtesten Fall 15, im Mittel 9 Takte.

16 DDR3-1600 Kanäle mit insgesamt 204 GByte/s und 128 MByte L3-Cache stehen für alle acht Panels gemeinsam zur Verfügung. Die I/O-Bandbreite beträgt 32 GByte/s und es werden zwei nicht weiter spezifizierte PCIe-Kanäle unterstützt. Jeder Xiaomi Kern fährt vier Out-of-Order-Pipelines mit bis zu 210 Befehlen „in flight“ und hat seinen eigenen jeweils 32 KByte großen L1-Caches für Instruktionen und Daten. Mit Intels Skylake-Kern zieht er mit diesem großen OoO-Fenster in etwa gleich. Phytium gibt aber, anders als Intel, weitaus mehr Details über die Funktionseinheiten und den internen Aufbau bekannt.

Vermutlich wird der Mars-Prozessor im 28-nm-Prozess von TSMC gefertigt. Derzeit fahren die Kerne einen Takt von 2 GHz und kommen bei Double Precision (vier DP-Flops pro Takt) so insgesamt auf 512 GFlops Spitzenleistung. Phytium gab für den im HPC-Bereich üblichen Linpack-Benchmark noch keinen Wert an, er dürfte aber bei ca. 90 Prozent der Spitzenleistung liegen. Stream-Triad kommt auf bis zu 85 GByte/s Speicherbandbreite.

Gemessen mit SPECint_2006base (19,2) und SPECfp_2006base (17,8) ohne Autoparallelisierung, liegt die Einzelleistung eines Kerns bei Single Thread nur etwa bei einem Drittel aktueller Intel Haswell-Prozessoren. Jedoch skaliert der Prozessor gut und kommt bei 64 Kernen dann auf 672 SPECint_rate2006_base und 585 SPECfp_rate2006_base. Ein System mit zweimal Xeon E5 2697v3 mit 56 logischen Kernen liegt, zum Vergleich, bei 1120 respektive 857. Allerdings müssen die Werte in Relation zur Energieaufnahme gesehen werden. Phytium hat 120 W TDP für den Mars spezifiziert, die beiden erwähnten Xeon-Prozessoren kommen zusammen auf 260 W TDP.

(mt, hannover)

(siehe auch heise-News-Ticker:)

Hannover · EDV-Beratung · Linux · Novell · Microsoft · Seminar · IT-Consult · Netzwerk · LPIC · CLE