Google’ın yapay zeka araştırmalarındaki en yeni adımı olan SIMA 2, geçen yıl duyurulan ilk SIMA sisteminin geliştirilmiş versiyonu olarak karşımıza çıkıyor. Yeni ajan, talimat takip etme becerisini akıl yürütme ve hedef odaklı eylemlerle birleştirerek çok daha kapsamlı bir yapay zeka deneyimi sunuyor. Özellikle sanal ortamlarda karmaşık görevleri yerine getirme kabiliyetiyle dikkat çekiyor.
Google DeepMind SIMA 2’nin Temel Yetenekleri
SIMA 2, yapay zeka alanındaki genel amaçlı ajan araştırmalarında önemli bir sıçramayı temsil ediyor. Yeni model, Google’ın ileri düzey çok modlu yapay zekası Gemini ile entegre çalışıyor. Bu güçlü entegrasyon sayesinde kullanıcıların yönlendirdiği yüksek seviyeli hedefleri analiz edebiliyor, yaptığı işlemler hakkında mantıksal çıkarımlar yapabiliyor ve neden o adımları uyguladığını açık bir şekilde ifade edebiliyor.
Ajan, gerçekleştirdiği görevleri adım adım açıklayarak süreci detaylandırabiliyor. Aynı zamanda sanal ortamı değerlendirip duruma göre uygun eylemler seçerek daha dinamik bir çalışma mantığı sunuyor.
Oyunlarda Genelleme ve Çok Modlu Öğrenme
SIMA 2’nin en dikkat çekici özelliklerinden biri, hiç görmediği oyunlarda bile karmaşık talimatları uygulayabilmesi. Viking temalı hayatta kalma oyunu ASKA veya eğitim odaklı MineDojo gibi ortamlarda bile başarılı performans sergileyebiliyor.
Yeni ajan uzun, çok adımlı görevleri anlayabiliyor ve çok modlu istemleri yorumlayabiliyor. Kullanıcılar SIMA 2’ye yazılı talimatların yanı sıra çizimler, farklı diller hatta emojiler ile komut verebiliyor. Dahası, bir oyunda öğrendiği “madencilik” bilgisini başka bir oyunda “hasat” işlemi için kullanabilmesi, modelin güçlü genelleme yeteneğini ortaya koyuyor.
Kendi Kendine Gelişim Döngüsü ve Mevcut Sınırlamalar
SIMA 2, başlangıçta insan gösterimleriyle eğitildikten sonra kendi başına gelişebilen bir yapıya sahip. Ajan, oyun oynayarak yeni deneyim verileri üretiyor ve bu verilerle kendini sürekli geliştiriyor. Bu döngüsel öğrenme süreci, zamanla daha karmaşık görevlerin üstesinden gelmesini sağlıyor.
Öte yandan SIMA 2’nin hâlâ bazı sınırlamaları bulunuyor. Özellikle:
- Uzun vadeli planlama gerektiren görevlerde,
- Çok hassas eylemler isteyen senaryolarda,
- Güçlü görsel algıya ihtiyaç duyan durumlarda
performans henüz tam olarak hedef seviyeye ulaşmış değil.
Google, SIMA 2’yi şimdilik akademik araştırmacılar ve oyun geliştiricileri için sınırlı bir önizleme olarak sunuyor. Bu da modelin gelecekte daha geniş bir kullanım alanına sahip olabileceğinin işareti olarak değerlendiriliyor.