Lenovo ThinkSystem SR685a V3: Wenn Genoa mit 8 MI300X, 51 TB und Titan-Netzteilen kuschelt

Michael Günsch
30 Kommentare
Lenovo ThinkSystem SR685a V3: Wenn Genoa mit 8 MI300X, 51 TB und Titan-Netzteilen kuschelt
Bild: Lenovo

Für „anspruchsvolle KI-Workloads“ hat Lenovo das neue ThinkSystem SR685a V3 im Programm. In dem Server mit 8 Höheneinheiten stecken zwei Epyc-Prozessoren der 9004-Serie (AMD Genoa). Die eigentliche Rechenleistung stammt aber von den 8 GPUs, wobei wahlweise AMD MI300X oder Nvidia H100 und später H200 oder B200 eingesetzt werden.

Der luftgekühlte 8U-Server soll sich laut Lenovo für Anwendungen wie Forschung, Modellierung oder Simulationen anbieten. Das Schlagwort „Generative AI“ steht aber wenig überraschend ganz oben auf der Liste. Für solche Berechnungen eignen sich die neuen HPC-Beschleuniger mit GPUs von AMD und Nvidia, sodass eben gleich acht davon unterkommen.

Hybrid-Server mit AMD MI300X oder Nvidia H100 (H200, B200)

Die GPUs sind untereinander direkt via Infinity Fabric bei AMD oder NVLink bei Nvidia verbunden, was für einen enormen Speicherdurchsatz sorgt. Kommen acht MI300X mit je 192 GB HBM zum Einsatz, soll die vollständig bidirektionale GPU-zu-GPU-Bandbreite bei 6,4 TB/s liegen. Bei acht Nvidia H100 mit je 80 GB HBM sind es sogar 7,2 TB/s, bei allerdings deutlich geringerem Speichervolumen. Den gleichen Durchsatz sollen acht H200 erreichen, die je 141 GB Speicher bieten. Für die erst 2025 erwarteten Nvidia B100 mit je 192 GB wird noch keine Angabe zur Bandbreite gemacht.

Eine frisch veröffentlichte Website von Lenovo nennt vorerst auch nur AMD MI300X und Nvidia H100 als mögliche Optionen, während ein älteres Dokument (PDF) auch H200 und B200 ins Spiel bringt.

Vorerst 2,25 TB RAM, 3 TB möglich

Den beiden CPUs des Typs Epyc 9004 mit bis zu 64 Kernen, 128 Threads und maximal 3,1 GHz bei 400 Watt TDP stehen laut Dokument bis zu 3 TB DDR5-RAM zur Verfügung, während auf der Website von maximal 2,25 TB mit 96-GB-DIMMs die Rede ist. Für 3 TB dürften womöglich zu einem späteren Zeitpunkt 128-GB-DIMMs in den 24 Steckplätzen zum Einsatz kommen. Die 12 Speicherkanäle jeder CPU werden bei Vollbestückung also mit je einem Speicherriegel versorgt.

Acht Netzwerkkarten und bis zu 51 TB Massenspeicher

Mit der bisher schnellsten Schnittstelle in Form von PCIe 5.0 x16 sind die Steckplätze für Erweiterungskarten versehen. Acht davon sitzen in der Front und erlauben den schnellen Austausch der Netzwerkkarten (NDR 400Gb/s InfiniBand mit GPU Direct Connect). Zwei weitere PCIe-5.0-x16-Slots sind auf der Rückseite für andere Aufgaben vorgesehen. Potenziell viel und auch zügigen Massenspeicher nehmen die 16 Hot-Swap-Einschübe mit PCIe 5.0 für NVMe-SSDs im 2,5"-Format auf. Maximal sollen 51,2 TB in Form von 16 3,2-TB-SSDs konfigurierbar sein. Für Boot-Datenträger sind zusätzlich zwei M.2-Slots samt RAID-Support vorgesehen.

ThinkSystem SR685a V3 (Bild: Lenovo)

Die redundante Stromversorgung erfolgt über acht Netzteile, die auf der Rückseite in Hot-Swap-Manier im laufenden Betrieb gewechselt werden können und nach 80 Plus Titanium besonders effizient arbeiten. Darunter befinden sich 10 Lüfter, die ihrerseits für einen schnellen Wechsel im Betrieb ausgelegt sind. Fünf weitere Lüfter sitzen in der Front.

ThinkSystem SR685a V3 (Bild: Lenovo)

Abbildungen veranschaulichen den Aufbau mit einer oben liegenden Compute-Platine, während die 8 GPUs auf dem „GPU Board“ im unteren Teil vor den zehn Hecklüftern des über 100 kg schweren Server-Racks sitzen.

Weitere Neuheiten

Im Presseportal von Lenovo finden sich weitere Neuzugänge. Darunter ist das ThinkSystem SD535 V3 als deutlich kleinere 1U-Lösung mit nur einer CPU, ohne GPU-Beschleuniger und mit deutlich weniger Massenspeicher. Außerdem gibt es das Lenovo ThinkAgile MX455 V3 als Edge-Server für Azure Stack HCI, der auf AMD Siena (Epyc 8004) baut.