
Intel 7nm Habana Gaudi2 ve Greco Derin Öğrenme Hızlandırıcılarını Tanıtıyor, NVIDIA’nın Ampere A100’üne Karşı Verim Performansının 2 Katına Kadar Çıktı
Veri merkezleri için en yeni Derin Öğrenme hızlandırıcıları Intel Habana Laboratuvarlarında tasarlandı. Bunlar, yüksek oranda DL eğitimi ve/veya çıkarım sunan en son özel Derin Öğrenme platformlarıdır. Bu yüzden ayrıntılarla başlayarak, öncelikle hem Habana Gaudi2’nin hem de Greco’nun 7 nm işlem düğümüne dayandığını belirtmeliyiz. Ne yazık ki, bu ayrıntı bize pek yardımcı olmuyor çünkü 7nm, TSMC, Intel 7 (önceden Intel 10nm) veya Intel 4 (önceden Intel 7nm ve en düşük ihtimalle) üzerindeki N7 sürecine atıfta bulunuyor olabilir.
Orijinal Habana Gaudi işlemcileri 16nm TSMC süreci üzerine inşa edildi ve bu da bu çipin N7 veya Intel 7’de olma olasılığını artırıyor.
Durum ne olursa olsun, Gaudi 2 platformunun açıkça 16nm’den (ki bu kendisi kabaca %50’lik bir yoğunluk artışı sağlar), özellikler, Gaudi2, medya kod çözme ve FP8 formatında çalışan işleme için 24 TPC’ye sahiptir (8 TPC’ye karşı). Bellek yapılandırması, 2,45 TB/s bant genişliği ve ek 48 MB SRAM sunan 96 GB HBM2e belleği içerir. Ağ iletişimi, 24 adet 100GbE anahtarı aracılığıyla sağlanır. Performansta böylesine büyük bir sıçrama, aynı zamanda TDP’nin önemli ölçüde yükseltilmesi gerektiği ve Gaudi2’nin 600W TDP’de (350W’a karşı) çalıştığı anlamına gelir.
Performans açısından, ResNet-50 eğitim çıktısı, Intel Habana Gaudi2 hızlandırıcı için tek bir A100 80 GB GPU’ya kıyasla 1,9 kat kazanç gösteriyor. NLP BERT Faz-1 Eğitiminde çip, Faz-2 eğitiminde 1,7x verime ve 2,8x verime sahiptir. Son olarak Intel, Gaudi2 için rakibi NVIDIA A100’e göre 2.0 kat kazanç gösteren bir BERT eğitim çıktısı karşılaştırması da hazırladı. Genel olarak, yeni hızlandırıcı, NVIDIA çözümlerine kıyasla eğitim maliyetlerinde %75’e varan tasarruf sağlar.
Ayrıca, en yüksek verimlilik için tasarlanmış ve aynı 7 nm işlem düğümüne dayanan bir derin öğrenme çıkarımı olan Intel Habana Greco da var. Hızlandırıcı, 240 GB/sn LPDDR5 bellek ve ek 128 MB çip üzerinde SRAM ile 16 GB bellek sunar. Hesaplama yetenekleri, medya kod çözme ve işleme için BF16, FP16 ve INT4 formatlarını içerir.
TDP sadece 75W olarak derecelendirilmiştir. Gaudi2’nin dahil olduğu OAM modülüyle karşılaştırıldığında, Greco tek yuvalı bir HHHL form faktöründe gelir. TDP değeri 75W olduğundan, kartta harici güç konektörlerine gerek yoktur.
Intel ayrıca, 7nm Gaudi2 işlemcinin şimdiden başlayarak müşterilere sunulacağını, Greco’nun ise 2022’nin ikinci yarısında belirli müşterileri örnekleyeceğini duyurdu.