News HPC-Beschleuniger: Intel Data Center GPU Max startet mit PCIe 5.0

MichaG

Redakteur
Teammitglied
Registriert
Juli 2010
Beiträge
13.009
  • Gefällt mir
Reaktionen: flo.murr, Onkel Föhn, BrollyLSSJ und 9 andere
"Max" kommt in den Ausführungen "Max", "Mäxchen" und "Maxens kleine Schwester Lilly."
 
  • Gefällt mir
Reaktionen: flo.murr, CDLABSRadonP..., Mcr-King und 3 andere
Die Max 1550 bietet mit 128 Xe-Cores und 128 GB HBM2e

Nicht schlecht Herr Specht, der HBM2e Speicherausbau mutet irgendwie schon gigantisch an und das wird noch sehr lange dauern bis die Gaming-Grafikkarten bei 128 GB (vermutlich dann immer noch GDDR und nicht HBM Speicher) ankommen werden.
 
  • Gefällt mir
Reaktionen: flo.murr, JDK91 und Mcr-King
Dass es Ponte Vecchio doch noch bis zum Marktstart geschafft hat… Angeblich erhielten die Karten mindestens 3 Steppings mit jeweils etlichen Revisionen.
 
  • Gefällt mir
Reaktionen: Mcr-King
6 Mal 600W und dann 13 Mal so schnell wie ein Xeon 8380 mit 270W?
3600/270=13,3.

Sorry, aber das ist doch ein Haufen 💩
 
  • Gefällt mir
Reaktionen: Onkel Föhn, rg88, C4rp3di3m und 3 andere
@Phoenixxl nicht zu vergessen das die Grafikkarten auch noch eine CPU brauchen aber wer weiß ob die wirklich auf vollem Stromverbrauch gelaufen sind
 
  • Gefällt mir
Reaktionen: Mcr-King und Makso
100 Milliarden Transistoren 😵‍💫 - das sind 1.000 Grafikchips der Generation R300 von ATi von Ende 2002 - wow
 
  • Gefällt mir
Reaktionen: Onkel Föhn, madmax2010, JDK91 und 2 andere
Sorry aber AMD klatscht auf die MI300 (eine Karte) 24 Cen4 Kerne CDNA3 und 128 GB HBM a900 Watt...
 
  • Gefällt mir
Reaktionen: Onkel Föhn, Mcr-King, Makso und eine weitere Person
"...Leistung gegenüber einem Xeon Platinum 8380 der vorherigen Generation...". Da ist es auch nicht allzu schwer größere Steigerungsraten zu erzielen. Erst der Vergleich mit der Konkurrenz wird zeigen, was der neue Chip Wert ist und wie es mit der Perf/Watt aussieht.
Wie @Phoenixxl schon ausgerechnet hat scheint die Effizienz gegenüber den alten Xeons praktisch gleich zu bleiben, wenn man für den Faktor 13 mehr als 6*600Watt verbraten muss.
 
  • Gefällt mir
Reaktionen: Onkel Föhn, Mcr-King, Makso und 2 andere
Phoenixxl schrieb:
Sorry, aber das ist doch ein Haufen 💩
Sieht erstmal nicht so gut aus, aber die Frage ist ob die TDP voll ausgeschöpft wurde. Und wenn man gegen den Xeon und seine TDP vergleicht, dann fehlt dort der RAM und die Spawa Verluste in der Rechnung. Bei den Beschleunigerkarten sollte das hoffentlich inkludiert sein.

Trotzdem hatte ich mehr erwartet.
 
  • Gefällt mir
Reaktionen: Onkel Föhn und Mcr-King
MichaG schrieb:
Die Intel Data Center GPU Max
Hier kann die Leistung gegenüber einem Xeon Platinum 8380 der vorherigen Generation bereits mit einem neuen Xeon Max mit HBM um etwa 30 Prozent gesteigert werden. Wird ein Xeon Max mit HBM mit den Data Center GPUs der Max Series kombiniert, steigt die Leistung fast um den Faktor 13. Allerdings werden dafür gleich sechs GPUs benötigt.
Nennt mich Blind, aber wo steht es, das es unbedingt die 600W Variante sein muss?
 
  • Gefällt mir
Reaktionen: madmax2010
nicht einmal ein Bild ausgegeben wird, denn die Grafikchips werden hier ausschließlich für kommerzielle oder wissenschaftliche Rechenaufgaben im Data Center genutzt

Wieso spricht man hier dann eigentlich immernoch von GPU?
 
  • Gefällt mir
Reaktionen: Mcr-King
vermutlich aus historischen Gründen damit man weiß dass es keine x86 oder ARM-Konstruktion ist (also CISC/RISC) sondern ein SoC der für massives paralleles Arbeiten (also kurze pipelines) und Matrizen ausgelegt ist.

P.S.: wo wir bei der Auslegung sind: wofür kann man im HPC-Segment die Raytracing-Einheiten verwenden? Ja, man kann KI-Kerne und shader teilweise für Raytracing zweckentfremden, aber umgekehrt?
Oder sind Intels Raytracingkerne quasi deren KI-Einheiten?
 
  • Gefällt mir
Reaktionen: Mcr-King und Yesman9277
Ja, manche professionelle Software kann RT Cores verwenden. Ansys kann es zur Antennen-Simulation oder Optik-Simation.
 
  • Gefällt mir
Reaktionen: madmax2010, pipip und Mcr-King
Phoenixxl schrieb:
Sorry, aber das ist doch ein Haufen 💩
LEDs schrieb:
aber wer weiß ob die wirklich auf vollem Stromverbrauch gelaufen sind
Känguru schrieb:
Wie @Phoenixxl schon ausgerechnet hat scheint die Effizienz gegenüber den alten Xeons praktisch gleich zu bleiben, wenn man für den Faktor 13 mehr als 6*600Watt verbraten muss.
Tzk schrieb:
Sieht erstmal nicht so gut aus

Vorwarnung: Ich bin an der Stelle sicher kein Experte.

Wenn ich Text, Bild und die unterhalb des Bildes verlinkte Quelle nicht falsch verstehe, sollte im Zuge des genutzten Benchmarks insbesondere die Speichergeschwindigkeit limitieren. Der Geschwindigkeitszuwachs müsste dementsprechend hauptsächlich auf den Speicher bzw. die Kommunikationsgeschwindigkeit zurückzuführen sein. Rohe Rechenleistung an sich wäre dann ein weiteres Paar Schuhe. Die Systeme besitzen neben den sechs GPUs wohl zwei (mit Sapphire Rapids) bestückte CPU-Sockel, da werden (in einer Molekulardynamiksimulation zumindest für mich gut vorstellbar) einige Komponenten erhöhten "Redebedarf" haben. :D

Ansonsten sind in der Quelle noch ein paar andere Benchmarks für Sapphire Rapids / Ice Lake (also CPU-Bezug!) genannt, wo dann höhere Faktoren zwischen den Ergebnissen anliegen, als dem Bild (also Speicherbezug) zu entnehmen sind.
Ergänzung ()

P.S.:
MichaG schrieb:
Wird ein Xeon Max mit HBM mit den Data Center GPUs der Max Series kombiniert, steigt die Leistung fast um den Faktor 13. Allerdings werden dafür gleich sechs GPUs benötigt.
Es sind zwei CPUs. ;) Es würde mich auch wundern (siehe restlicher Text), wenn man CPU-Anzahlen mischt, auch wenn das aus der Quelle (für mich) nicht hervorgeht.

(Es geht (zugegebenermaßen) ein bisschen durcheinander mit "Combining [...] with the Max series CPU platform" und 'konkreten' "CPUs"... :freaky:

Für alles "mit GPUs" steht's jedenfalls im Text, sonst wird's mit einer CPU auch bzgl. der PCIe-Lanes (80 pro CPU lt. hier:
Eine CPU liefert gleich 80 PCIe-5.0-Lanes, die abwärtskompatibel auch mit PCIe 4.0 funktionieren.
) auf sechs GPUs (mit je x16) unnötig eng. Aufbau der CPU(s)-only-Systeme sind aber hoffentlich der Vergleichbarkeit halber auch immer zwei CPUs...)
Combining the Max series GPU with the Max series CPU platform (in a three to one GPU:CPU ratio) offers a 12.9x performance boost for LAMMPS molecular dynamics workloads, compared with an Ice Lake platform without GPUs, according to benchmarking conducted by Intel. The addition of Max GPUs (six GPUs added to a 2-CPU server) translated into a 9.9x boost versus a Max series CPU-only platform for the same workload. The high bandwidth memory on the host CPUs enabled a 1.55x performance improvement compared to using DDR5 only. (Photo of demonstration given in Hillsboro, Oregon, last month.)
(Quelle wie im Artikel verlinkt; Hervorhebungen durch mich.)
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: bensen, Mcr-King und Makso
Chismon schrieb:
Nicht schlecht Herr Specht, der HBM2e Speicherausbau mutet irgendwie schon gigantisch an und das wird noch sehr lange dauern bis die Gaming-Grafikkarten bei 128 GB (vermutlich dann immer noch GDDR und nicht HBM Speicher) ankommen werden.
Naja, ist aber nichts besonderes. AMDs Instinct MI250X hat auch 128GB und ist seit gut einem Jahr auf dem Markt. Die HPC Beschleuniger haben immer mehr VRAM als die Gamer Dinger.
 
  • Gefällt mir
Reaktionen: Onkel Föhn, madmax2010, Mcr-King und eine weitere Person
Chismon schrieb:
Nicht schlecht Herr Specht, der HBM2e Speicherausbau mutet irgendwie schon gigantisch an und das wird noch sehr lange dauern bis die Gaming-Grafikkarten bei 128 GB (vermutlich dann immer noch GDDR und nicht HBM Speicher) ankommen werden.
ok, aber hat leider nix mit Server zu tun
 
incurable schrieb:
"Max" kommt in den Ausführungen "Max", "Mäxchen" und "Maxens kleine Schwester Lilly."
Hanlo I Bims :)
Ergänzung ()

andi_sco schrieb:
100 Milliarden Transistoren 😵‍💫 - das sind 1.000 Grafikchips der Generation R300 von ATi von Ende 2002 - wow
ich erinnere mich noch, wie ich als sehr junger Teenager in einer c't gelesen habe. Ein langer Artikel ueber die erste CPU mit mehr als einer Miliarde Transistoren. Ein Itanium mit 2 Kerben.
Oh Wow. die R300 war die 1. mit 100 Mio und noch in 150nm
Heute stecken Milliarden in Smartphone SOCs. Immer wieder faszinierend.
und alles haengt nis heute am takt von, fies gesagt, geschliffenen Quartzkristallen dieals tsktgeber dienen.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: andi_sco
Also der Xeon Max mit HBM ist ~30% schneller als der Xeon Platinum 8380.
Blöd nur das der nur halb so teure EPYC 7763 (€4200) ~38% schneller ist als ein Xeon Platinum 8380 (€9100).
Wenn man den gleich teuren Epyc 9654 (€8600,-) vergleicht dann sind wir schon bei 60-100% Vorsprung für den Epyc.
Molecular Dynamics and Parallel Compute Benchmarks

Also bin ich mit einem Server mit 8 Epyc 9654 schon schneller unterwegs als mit einem Xeon Max mit HBM + 6x Max 1550 GPU´s.
 
Zurück
Oben