AMD, bu konuda daha fazla bilgi sundu. CDNA 2 “Aldebaran” GPU destekli Instinct MI200 serisi bir MCM tasarımına sahip ilk olanlardır. Instinct MI200 GPU’ları, Hot Chips 34 sırasında AMD Architects, Alan Smith ve Norman James tarafından detaylandırılmıştır.
AMD, Aldebaran “CDNA 2” Instinct MI200 Serisi GPU Blok Şemasına İlk Bakış Sunuyor, HPC’de MCM Tasarımını Özelleştiren İlk
AMD, resmi olarak MCM teknolojisini ilk kullanan şirkettir ve bunu Instinct MI200 kod adlı Aldebaran olan büyük bir ürünle yapıyorlar. AMD Aldebaran GPU, çeşitli biçim ve boyutlarda olacak, ancak hepsi Vega’nın en rafine varyasyonu olan yepyeni CDNA 2 mimarisine dayanıyor. Ayrıntılara girmeden önce ana özelliklerden bazıları aşağıda listelenmiştir:
- AMD CDNA 2 mimarisi – FP64 ve FP32 matris işlemlerini hızlandıran 2. Nesil Matrix Çekirdekleri, AMD önceki nesil GPU’lara kıyasla en yüksek teorik FP64 performansını 4 kata kadar sunar.
- Liderlik Paketleme Teknolojisi – 2.5D Yükseltilmiş Fanout Bridge (EFB) teknolojisine sahip endüstride bir ilk olan çok kalıplı GPU tasarımı, AMD önceki nesil GPU’lara kıyasla 1,8 kat daha fazla çekirdek ve 2,7 kat daha yüksek bellek bant genişliği sunarak 3,2 terabayt ile endüstrinin en iyi toplam tepe teorik bellek bant genişliğini sunar her saniye.
- 3. Nesil AMD Infinity Fabric teknolojisi – 8 adede kadar Infinity Fabric bağlantısı, AMD Instinct MI200’ü 3. Birleştirilmiş CPU/GPU bellek tutarlılığını sağlamak ve sistem verimini en üst düzeye çıkarmak için düğümdeki Gen EPYC CPU’lar ve diğer GPU’lar, CPU kodlarının hızlandırıcıların gücünden faydalanması için daha kolay bir rampa çıkışına olanak tanır.
AMD Instinct MI200 GPU Kalıp Atışı:
AMD Instinct MI200’ün içinde, ikincil ve birincil olmak üzere iki kalıp içeren bir Aldebaran GPU bulunur. Toplam 16 SE için her biri 8 shader motorundan oluşan iki kalıbı vardır. Her Shader Motoru, tam oranlı FP64, paketlenmiş FP32 ve FP16 ve BF16 işlemleri için 2. Nesil Matrix Motoru içeren 14 CU’yu paketler. Tüm GPU, TSMC’nin 6nm işlem düğümünde üretilmiştir ve toplam 58 Milyar transistörle birlikte gelir.
AMD Instinct MI200 GPU Blok Şeması:
Her kalıp, 112 bilgi işlem biriminden veya 7.168 akış işlemcisinden oluşur. Bu, tüm çip için toplam 224 işlem birimi veya 14.336 akış işlemcisine kadar yuvarlar. Aldebaran GPU ayrıca yeni bir XGMI ara bağlantısı tarafından desteklenmektedir. Her yongada bir VCN 2.6 motoru ve ana IO denetleyicisi bulunur. Her GPU yongasında, HBM2e belleği için dört adet 1024 bit bellek denetleyicisi bulunur.
Önbelleğe gelince, her bir GPU yongası, fiziksel olarak 32 dilime bölünmüş toplam 8 MB L2 kapasitesine sahiptir. Her dilim, gelişmiş kuyruğa alma ve tahkim artı gelişmiş atomik işlemlerle 128B/CLK sunar. GCD başına bellek alt sistemi, verimli çalışma voltajı için 64B/CLK ile 32 kanala bölünmüş GCD başına birleştirilmiş 1,6 TB/s bant genişliğine sahip yonga başına 64 GB HBM2e belleği içerir. Paket içi ara bağlantı, iki GCD arasında 400 GB/sn iki bölümlü bant genişliği içerir.
PCI-Express ara bağlantısı için her bir GPU’da kullanılabilen toplam 8 Infinity Fabric ara bağlantısı vardır. Ara bağlantı, 144 GB/s’lik tutarlı bir CPU-GPU aktarım hızında derecelendirilmiştir. Toplam dört MI200 serisi GPU ile harici Infinity Fabric bağlantısını kullanarak 500 GB/sn’ye kadar ölçeklendirebilir veya 100 GB/sn bant genişliği için bir PCIe Gen 4 ESM AIC kullanarak ölçeği genişletebilirsiniz.
AMD Instinct MI200 “Aldebaran GPU” Performans Metrikleri:
Performans açısından AMD, AMG’de 3 kata kadar performans iyileştirmesi ile NVIDIA’nın A100 çözümü karşısında HPC segmentinde çeşitli rekor zaferler elde ediyor.
DRAM’a gelince, AMD, 8192 bit geniş veri yolu arabirimi için 1024 bit arabirimlerden oluşan 8 kanallı bir arabirim ile gitti. Her arayüz 2GB HBM2e DRAM modüllerini destekleyebilir. Bu bize yığın başına 16 GB’a kadar HBM2e bellek kapasitesi vermeli ve toplamda sekiz yığın olduğundan, toplam kapasite miktarı 128 GB’a kadar çıkabilir. Bu, 80 GB HBM2e belleğe sahip A100’den 48 GB daha fazla. Bellek, 3,2 TB/sn’lik tam bant genişliği için 3,2 Gb/sn’lik çılgın bir hızda çalışır. Bu, 2 TB/sn’ye sahip A100 80 GB’den 1,2 TB/sn daha fazla bant genişliği demektir.