Yapay zeka modellerinin büyümesi ve yüksek performanslı hesaplama ihtiyacının artması, veri merkezlerinde bellek kapasitesini kritik bir sorun haline getiriyor. Grafik işlem birimleri daha güçlü hale gelse de, fiziksel bellek sınırları büyük dil modellerinin eğitimi ve çalıştırılması sırasında performansı düşürebiliyor. Güney Koreli Elektronik ve Telekomünikasyon Araştırma Enstitüsü, bu soruna yönelik olarak OmniXtend adlı yeni bir bellek paylaşım mimarisi geliştirdi. Teknoloji, standart Ethernet altyapısını kullanarak farklı sunucular ve hızlandırıcılar arasında ortak bir bellek havuzu oluşturmayı amaçlıyor.
BELLEK AĞ ÜZERİNDEN PAYLAŞILIYOR
Geleneksel veri merkezi mimarilerinde bellek, çoğunlukla sunucu anakartı üzerinde yerel olarak sınırlı kalıyor. Bellek kapasitesi yetersiz olduğunda sistemin genişletilmesi pahalı donanım değişiklikleri gerektirebiliyor. OmniXtend ise bellek kaynaklarını fiziksel cihazlardan ayırarak ağ üzerinden erişilebilir hale getiriyor. Böylece farklı sunucular, işlemciler ve hızlandırıcılar, aynı bellek havuzundan dinamik olarak yararlanabiliyor. ETRI’ye göre bu yapı, veri merkezi işletmecilerinin mevcut sunucuları tamamen değiştirmeden bellek kapasitesini genişletmesine imkân tanıyor. Standart Ethernet anahtarlarının kullanılabilmesi de sistemin büyük ölçekli yapay zeka eğitim ortamlarına daha düşük maliyetle uyarlanmasını sağlayabilir.
LLM PERFORMANSINDA ARTIŞ
Araştırmacılar, OmniXtend mimarisinin özellikle bellek kısıtı yaşanan büyük dil modeli uygulamalarında performans avantajı sunduğunu belirtiyor. Yapılan testlerde, bellek yetersizliği nedeniyle düşen LLM çıkarım performansının Ethernet tabanlı bellek genişletmesiyle iki kattan fazla arttığı ve tam kapasiteli donanıma yakın seviyeye ulaştığı bildirildi. Bu sonuç, yapay zeka veri merkezlerinde bellek yönetiminin yalnızca kapasite değil, enerji ve işletme verimliliği açısından da önemli olduğunu gösteriyor.

AÇIK KAYNAKLA GELİŞTİRİLİYOR
OmniXtend teknolojisi, Mayıs 2025’te Paris’te düzenlenen RISC-V Summit Europe ve ABD’deki RISC-V Summit North America etkinliklerinde tanıtıldı. Teknoloji, yapay zeka donanımı ve yarı iletken ekosistemindeki firmaların ilgisini çekti. ETRI, Linux Vakfı’nın CHIPS İttifakı bünyesindeki Bağlantı Çalışma Grubu’na da liderlik ediyor. Enstitü, yapay zeka ağ iletişimi ve bellek genişletme alanında açık kaynak standartlarının geliştirilmesine katkı sağlıyor.
VERİ MERKEZLERİNDEN GÖMÜLÜ SİSTEMLERE
ETRI Geleceğin Hesaplama Araştırma Bölümü Başkan Yardımcısı Kim Kang Ho, sistemi NPU, GPU ve CPU gibi farklı hızlandırıcılar arasında paylaşımlı bellek mimarisine dönüştürdüklerini belirtti. Kim, uluslararası iş birlikleriyle bu teknolojinin küresel yapay zeka ve yarı iletken şirketlerinin yeni nesil veri merkezi donanımlarına entegre edilmesini hedeflediklerini söyledi. ETRI, teknolojiyi veri merkezi donanım ve yazılım şirketlerine aktararak ticarileştirmeyi planlıyor. Bir sonraki aşamada ise OmniXtend mimarisinin otomotiv ve denizcilik gibi yüksek güvenilirlik gerektiren gömülü sistemlerde kullanılması hedefleniyor.