Teknoloji

Yapay zekanın bellek sorunu bu çiple çözülebilir

Klasik 2D çiplerde bileşenler tek bir düzlem üzerinde yayılırken, bu yeni tasarımda devre katmanları “üst üste” inşa ediliyor. Katmanlar arasındaki dikey bağlantılar sayesinde bellek ile hesaplama birimleri arasındaki veri akışı ciddi biçimde kısalıyor. Bu da yapay zekâ iş yüklerinin en büyük darboğazlarından biri olan “veriyi taşıma” meselesine doğrudan dokunuyor.

BELLEK DUVARI SORUNU

Günümüz yapay zekâ sistemleri, devasa miktarda veriyi bellekten alıp işlem birimlerinde işlemek zorunda. Sorun şu: İşlem birimleri inanılmaz hızlanırken, bellekten veri taşıma hızı aynı tempoda artmıyor. Bu uyumsuzluk yıllardır “bellek duvarı” diye anılan temel bir sınıra dönüşmüş durumda. Üstelik transistörleri sürekli küçültüp daha fazlasını sığdırma yaklaşımı da fiziksel sınırlara yaklaşmış durumda; araştırmacıların “minyatürleştirme duvarı” dediği ikinci bir tıkanma da burada devreye giriyor.

Yeni monolitik 3D tasarım, bu iki duvarı da “yukarı doğru büyüyerek” aşmayı amaçlıyor: Belleği ve hesaplamayı dikeyde birbirine yaklaştırıp araya çok daha fazla bağlantı koyarak, verinin çip içinde dolaşmasına harcanan zamanı ve enerjiyi azaltıyor.

ÇİPİ FARKLI KILAN

Bugüne kadar 3D çip denemeleri yapıldı; ancak çoğu yaklaşım, ayrı ayrı üretilen çipleri üst üste koymaya dayanıyordu. Bu yöntem işe yarasa da katmanlar arası bağlantılar nispeten daha kaba, seyrek ve darboğaza daha yatkın olabiliyor. Bu yeni prototipte ise katmanlar tek bir sürekli üretim akışıyla, alttaki devrelere zarar vermeyecek düşük sıcaklıklı bir süreçle, doğrudan üst üste inşa ediliyor. “Monolitik” vurgusu tam olarak buradan geliyor: Ayrı parçaları sonradan birleştirmek yerine, tek bir yapıda katman katman yükselmek.

Ekip, ölçüm ve simülasyon sonuçlarının 2D tasarımlara kıyasla “bir mertebe” seviyesinde hızlanmaya işaret ettiğini söylüyor. Erken donanım testlerinde, benzer düz 2D yaklaşımlara göre yaklaşık 4 kata varan üstünlük görülürken; daha fazla katmanla büyütülen gelecekteki sürümler için yapılan simülasyonlar, gerçek yapay zekâ iş yüklerinde 12 kata kadar kazanım potansiyeli gösteriyor. Bu iş yükleri arasında Meta’nın açık kaynak LLaMA modelinden türetilen senaryolar da bulunuyor.

İşin uzun vadeli hedefi sadece “daha hızlı” bir çip değil. Araştırmacılar, hız ve enerji verimliliğini birlikte değerlendiren enerji-gecikme çarpanı (EDP) açısından yüz ile bin kat aralığında iyileşme için gerçekçi bir yol açıldığını vurguluyor. Çünkü dikey bağlantılar, veriyi hem daha kısa mesafede taşıyor hem de aynı anda daha fazla “yol” üzerinden akmasına izin veriyor; bu da bir yandan işlem hacmini artırırken diğer yandan işlem başına enerji maliyetini düşürebiliyor.