Pazartesi, Mart 4, 2024
Ana Sayfa do7 4. Nesil Tensör Çekirdeğe Sahip NVIDIA Hopper H100 Saat Başına Saatten İki...

4. Nesil Tensör Çekirdeğe Sahip NVIDIA Hopper H100 Saat Başına Saatten İki Kat Daha Hızlı, Frekans %30 Performans Kazancı Sağlıyor

- Advertisement -

4. Nesil Tensör Çekirdeğe Sahip NVIDIA Hopper H100 Saat Başına Saatten İki Kat Daha Hızlı, Frekans %30 Performans Kazancı Sağlıyor
4. Nesil Tensör Çekirdeğe Sahip NVIDIA Hopper H100 Saat Başına Saatten İki Kat Daha Hızlı, Frekans %30 Performans Kazancı Sağlıyor

NVIDIA Kepler GK110 GPU, Hopper H100 GPU’da Tek Bir GPC’ye Eşdeğerdir, 4. Nesil Tensör Çekirdekleri 2 Kat Daha Hızlı

AMD, HPC GPU’larında MCM yaklaşımını benimserken, NVIDIA şimdilik monolitik tasarıma bağlı kalmaya karar verdi. Hopper H100, TSMC’nin 4N işlem düğümü kullanılarak yapılan en büyük GPU’lardan biridir, optimize edilmiş ve yalnızca NVIDIA için yapılmış bir tasarım.

H100 GPU, en son 4nm teknolojisiyle dolu olarak gelen ve son teknoloji HBM3 bellek teknolojisiyle birlikte 80 Milyar transistör içeren bir canavar çiptir. H100, Hopper H100 GPU’yu 6 yığınlı bir HBM3 tasarımıyla birleştirmek için TSMC’nin CoWoS teknolojisini kullanan 30’dan fazla güçlü VRM’ye ve devasa bir entegre aracıya sahip PG520 PCB kartı üzerine inşa edilmiştir. Hopper H100 GPU’nun ana teknolojilerinden bazıları şunlardır:

  • 132 SM (Saat Başına 2x Performans)
  • 4. Nesil Tensör Çekirdekleri
  • Blok Kümeleri
  • 2. Nesil Çok Örnekli GPU
  • Gizli Bilgi İşlem
  • PCIe Gen 5.0 Arayüzü
  • Dünyanın İlk HBM3 DRAM’i
  • Daha Büyük 50 MB L2 Önbellek
  • 4. Nesil NVLink (900 GB/sn Toplam Bant Genişliği)
  • Yeni SHARP desteği
  • NVLink Ağı

Altı yığının dışında, verim bütünlüğünü sağlamak için iki yığın tutulur. Ancak yeni HBM3 standardı, çılgınca olan 3 TB/sn hızlarda 80 GB’a kadar kapasiteye izin veriyor. Karşılaştırma için, mevcut en hızlı oyun grafik kartı olan RTX 3090 Ti, yalnızca 1 TB/s bant genişliği ve 24 GB VRAM kapasitesi sunuyor.

Bunun dışında, H100 Hopper GPU da en yeni FP8 veri formatında paketler ve yeni SXM bağlantısı aracılığıyla çipin etrafında tasarlandığı 700W güç tasarımına uyum sağlamaya yardımcı olur. Ayrıca FP32 ve FP64 FMA oranlarının iki katı ve 256 KB L1 önbellek (paylaşılan bellek) sunar.

Bir Bakışta NVIDIA Hopper H100 GPU Özellikleri

Spesifikasyonlara gelince, NVIDIA Hopper GH100 GPU, toplam 8 GPC’de bulunan devasa bir 144 SM (Akış Çok İşlemcili) yonga düzeninden oluşur. Bu GPC’ler, her biri 2 SM biriminden oluşan toplam 9 TPC’yi sallar. Bu bize GPC başına 18 SM ve tam 8 GPC konfigürasyonunda 144 SM verir. Her SM, bize toplam 18.432 CUDA çekirdeği vermesi gereken 128 FP32 biriminden oluşur.

H100 yongasından bekleyebileceğiniz yapılandırmalardan bazıları şunlardır:

GH100 GPU’nun tam uygulaması aşağıdaki birimleri içerir:

  • 8 GPC, 72 TPC (9 TPC/GPC), 2 SM/TPC, tam GPU başına 144 SM
  • SM başına 128 FP32 CUDA Çekirdeği, tam GPU başına 18432 FP32 CUDA Çekirdeği
  • SM başına 4 Dördüncü Nesil Tensör Çekirdeği, tam GPU başına 576
  • 6 HBM3 veya HBM2e yığını, 12 512 bit Bellek Denetleyicisi
  • 60 MB L2 Önbellek
  • Dördüncü Nesil NVLink ve PCIe Gen 5

SXM5 kart form faktörüne sahip NVIDIA H100 GPU, aşağıdaki birimleri içerir:

  • 8 GPC, 66 TPC, 2 SM/TPC, GPU başına 132 SM
  • SM başına 128 FP32 CUDA Çekirdeği, GPU başına 16896 FP32 CUDA Çekirdeği
  • SM başına 4 Dördüncü Nesil Tensör Çekirdeği, GPU başına 528
  • 80 GB HBM3, 5 HBM3 yığını, 10 512 bit Bellek Denetleyicisi
  • 50 MB L2 Önbellek
  • Dördüncü Nesil NVLink ve PCIe Gen 5

Bu, tam GA100 GPU yapılandırmasına göre 2,25 katlık bir artıştır. NVIDIA ayrıca Hopper GPU’su içinde performansı büyük ölçüde artıracak daha fazla FP64, FP16 ve Tensor çekirdeğinden yararlanıyor. Ve bu, aynı zamanda 1:1 FP64’e sahip olması beklenen Intel’in Ponte Vecchio’suna rakip olmak için bir gereklilik olacak. NVIDIA, Hopper’daki 4. Nesil Tensör Çekirdeklerinin aynı saatte 2 kat daha fazla performans sunduğunu belirtiyor.

Aşağıdaki NVIDIA Hopper H100 performans dökümü, ek SM’lerin yalnızca %20’lik bir performans artışı olduğunu göstermektedir. Ana fayda, 4. Nesil Tensör Çekirdeklerinden gelir ve FP8 yolu hesaplar. Daha yüksek frekans, karışıma %30’luk iyi bir artış da ekler.

GPU ölçeklendirmesine dikkat çeken ilginç bir karşılaştırma, Hopper H100 GPU’daki tek bir GPC’nin, 2012’nin amiral gemisi HPC yongası olan Kepler GK110 GPU’ya eşdeğer olduğunu gösteriyor. Kepler GK110 toplam 15 SM içeriyorken Hopper H110 GPU’da 132 SM bulunuyor. ve Hopper GPU’daki tek bir GPC bile, Kepler amiral gemisindeki SM’lerin tamamından %20 daha fazla olan 18 SM’ye sahiptir.

Önbellek, NVIDIA’nın çok dikkat ettiği ve Hopper GH100 GPU’da 48 MB’a çıkardığı başka bir alandır. Bu, Ampere GA100 GPU’da bulunan 50 MB önbelleğe göre %20’lik bir artış ve AMD’nin amiral gemisi Aldebaran MCM GPU’su MI250X’in boyutunun 3 katı.

Performans rakamlarını özetleyen NVIDIA’nın GH100 Hopper GPU’su, FP8 için 4000 TFLOP, FP16 için 2000 TFLOP, TF32 için 1000 TFLOP ve FP64 Hesaplama performansı için 60 TFLOP sunacak. Bu rekor kıran rakamlar, kendisinden önce gelen tüm diğer HPC hızlandırıcılarını yok ediyor. Karşılaştırma için, bu NVIDIA’nın kendi A100 GPU’sundan 3,3 kat daha hızlı ve FP64 hesaplamasında AMD’nin Instinct MI250X’inden %28 daha hızlı. FP16 hesaplamasında, H100 GPU, A100’den 3 kat ve MI250X’ten 5,2 kat daha hızlıdır ki bu tam anlamıyla çılgındır.

BENZER YAZILAR

Hint Enerji Şirketi Tata Power’ın BT Altyapısı Siber Saldırıya Uğradı

Hindistan'ın en büyük entegre enerji şirketi Tata Power Company Limited, Cuma günü bir siber saldırı tarafından hedef alındığını doğruladı. BT altyapısına izinsiz giriş, şirketin "bazı...

Kendi Ayakları üstünde – İpek Ongun

KİTABIN ADI: KENDİ AYAKLARI ÜSTÜNDEKİTABIN YAZARI: İPEK ONGUNBASIM TARİHİ : 1999YAYIN EVİ İNKILAP YAYINEVİKİTABIN ÖZETİ / TANITIMI :KENDİ AYAKLARI ÜZERİNDE DURMAK :Günlük 24 Haziran’la...

katledilen piramit

KİTABIN ÖZETİ :Katledilen Piramit yazarın ‘Mısır Yargıcı’ başlığını taşıyan üçlemesinin ilk kitabıdır. Bu üçlemenin diğer kitapları: Çöl Yasası ve Vezirin Adaleti’dir. İlk kitap olması...

POPÜLER YAZILAR

Lazer Hassasiyeti, NASA’nın Navigasyon Doppler Lidar’ı ile Ay Keşifleriyle Buluşuyor

NASAAy gösterisi için hazırlanan Navigasyon Doppler Lidar teknolojisi, uzay araştırmalarının ötesinde sonuçları olan iniş teknolojisindeki ilerlemeleri vurguluyor. Bu ayın sonlarında, NASA'nın ticari ay teslimat hizmetleri...

Ay, Mars ve Ötesi için Öncü Fisyon Enerjisi

NASA özerklik, güvenlik ve uzun vadeli çalışmaya odaklanarak Ay için bir nükleer fisyon reaktörü geliştirmeye yönelik Fisyon Yüzey Enerjisi Projesi ile ilerliyor. Bu çaba,...

Yeni Nesil OLED Teknolojisinin Arkasındaki Sır

Durham Üniversitesi'ndeki bilim adamlarının yeni bir araştırması, daha parlak, daha verimli ve daha kararlı mavi organik ışık yayan diyotlara (OLED'ler) doğru beklenmedik bir yolu...

SEC’in X hesabı, Bitcoin ETF onayına ilişkin sahte haberler yayınlamak için saldırıya uğradı

Birisi, ABD Menkul Kıymetler ve Borsa Komisyonu'nun (SEC) X (eski adıyla Twitter) hesabını ele geçirdi ve kurumun, kayıtlı ulusal güvenlik borsalarında Bitcoin ETF'lerinin (borsada...