Nvidia , Grace CPU ve ilgili Superchip dizaynını birinci Sefer GTC 2022 ‘de duyurmuştu. Grace CPU, Nvidia’nın sunucu ve HPC segmentini hedeflediği Arm mimarisine dayalı birinci işlemcisi olurken performans manasında ise AMD EPYC Milan işlemcileri Aleni Ara farkla geride bırakıyor üzere görünüyor.
Nvidia Grace CPU Superchip özellikleri
Nvidia Grace CPU Superchip’in öne çıkan özellikleri ortasında 144 Arm v9 Neoverse V2 çekirdeği ve ECC bellekli dünyanın birinci LPDDR5x yapılandırması dikkat çekiyor. Bu yapılandırma 1TB/sn bant genişliği sunarken 900 GB/s arayüzünde PCIe Gen 5’ten 7 kat daha yüksek suratlar vadediyor.
Nvidia’nın birinci sunucu CPU’su olan Grace, SVE2 ve Nested Virtualization ve S-EL2 üzere Çeşitli sanallaştırma uzantıları için dayanak sunan 72 Arm v9.0 çekirdeğine sahip durumda. CPU, TSMC ‘nin Nvidia için Özel olarak yapılmış 5nm sürecinin optimize edilmiş bir versiyonu olan 4N sürecinde üretiliyor.
Grace eşlenecek formda tasarlanmış bir altyapı sunuyor. Münasebetiyle dizaynın en Değerli istikameti C2C yani çipten çipte Aralık irtibat sunuyor olmasıdır. Bu sayede çift Grace CPU ya da Grace CPU + Hopper H100 GPU üzere kombinasyonların yapılması mümkün. Grace bu esnekliği Superchip’leri yapmak için kullanılan ve tipik bir çapraz soket yapılandırmasıyla alakalı bütün darboğazları ortadan kaldıran NVLINK köprüsü sayesinde yapıyor. C2C NVLINK Ara teması Fazla düşük bir Sıkıntı tüketimine sahipken 900 GB/sn olmamış çift istikametli bant genişliği sağlayabiliyor. Ayrıyeten devir üzerine konumlandırılan Grace+Hopper Superchip’i NVSwitch aracılığıyla birbirine bağlanabiliyor. Bu sayede Superchip üzerindeki Grace CPU, öbür yongadaki GPU ile direkt irtibat kurabiliyor ve hatta Mahallî NVLINK hızlarında VRAM’ine erişebiliyor.
Nvidia Grace CPU, dağıtılmış bir önbellek dizaynına sahip ölçeklenebilir bir yapıyı Mümkün kılıyor. Bu sayede çipin 3,225 TB/sn’ye kadar ikiye bölünmüş bant genişliği sunması Mümkün oluyor. Ayrıyeten çekirdek başına 117 MB L3 önbellek sunuluyor olması da verimliliği artırıyor. hafıza tarafındaysa Nvidia, 32 kanalda 960 GB’a kadar LPDDR5X (ECC) ve 1 TB/s’ye kadar hafıza bant genişliği verebiliyor. Öte yandan çift CPU’lu heyetimde talep edilen TDP ise 500W.
Grace CPU performansı oldukça iddialı
Nvidia tarafından sergilenen performans rakamları, OpenFOAM, WRF, NEMO ve BWA üzere Çeşitli HPC Amel yüklerinde Grace CPU Superchip’i çift soketli (2P) AMD EPYC 7763 “Milan” işlemcileri ile karşılaştırıyor. EPYC Milan’ın AMD’nin bir evvelki jenerasyonu olduğunu bilmemiz burada Kıymetli olacaktır. Buna nazaran, OpenFOAM’da Grace CPU Superchip, 3,5 kata kadar verimlilikle 2,5 kata kadar bir performans artışı elde ettiği görülüyor. Ortalama olarak , ise yeni Grace CPU Superchip’i, AMD’nin EPYC Milan CPU’larına kıyasla vat başına 1,9 kat performans artışı ve 2,57 kat verimlilik artışı sunabiliyor. Hasebiyle bu pahalarla Nvidia’nın AMD ve Intel’in en yeni sunucu yongalarına karşı da rekabetçi olduğunu söyleyebiliriz.
Nvidia, Grace’in 1 trilyondan Çok parametreye sahip yeni jenerasyon NLP modellerinin eğitimi üzere Amel yüklerini hedefleyen hayli Özel bir işlemci olduğunu belirtiyor. Grace CPU’ların x86 yongalarına karşı nasıl bir performans sergileyeceğini gerçek hayatta görmek Değişik olacaktır. AMD’nin Genoa ve Intel’in Sapphire Rapids CPU’ları ile rekabet edecek olan Grace işlemcileri birinci olarak ATOS harika bilgisayarında kullanılacak.
Yorum Yok