Google DeepMind, Gemini Destekli SIMA 2 ile Sanal Dünyalarda AI Deneyini Geliştiriyor

Google DeepMind, dil ve mantık yeteneklerini Gemini büyük dil modeliyle birleştiren genel amaçlı yapay zeka ajanının yeni nesli SIMA 2’nin ön izleme sürümünü paylaştı. Araştırmacılar, SIMA 2’nin yalnızca talimatları takip etmekle kalmayıp çevresini anlayıp etkileşimde bulunabilen bir yapay zekaya dönüştüğünü belirtiyor.

İlk SIMA sürümü, yüzlerce saatlik video oyunu verisiyle eğitilmiş ve 3B oyunlarda insan gibi oynayabilen bir ajan olarak Mart 2024’te tanıtılmıştı. Ancak SIMA 1, karmaşık görevleri tamamlamada yalnızca %31 başarı oranına sahipti; insanlarda bu oran %71’di.

Google’dan Yapay Zekâ Destekli Alışveriş İçin Açık Standart

Google’dan Sağlık Aramalarında AI Overviews Geri Adımı

Grok’un Görsel Özelliğine Ücret Kısıtlaması

DeepMind Kıdemli Araştırma Bilimcisi Joe Marino, “SIMA 2, SIMA 1’e göre yeteneklerde büyük bir adım. Artık daha genel bir ajan, önce görülmemiş ortamlarda karmaşık görevleri tamamlayabiliyor ve kendi deneyimlerinden öğrenerek kendini geliştirebiliyor” dedi. SIMA 2, Gemini 2.5 flash-lite modeliyle çalışıyor ve AI topluluğunda AGI (genel yapay zeka) olarak tanımlanan, çok yönlü entelektüel görevleri yerine getirebilen sistemlere doğru bir adım olarak görülüyor.

DeepMind araştırmacıları, “bedenselleştirilmiş ajanlarla” çalışmanın genel zekâya ulaşmak için kritik olduğunu vurguluyor. Bedenselleştirilmiş ajan, bir robot veya insan gibi fiziksel veya sanal dünyada gözlem yapıp eylemde bulunabiliyor. SIMA 2, yalnızca oyun oynamanın ötesine geçerek kullanıcı taleplerini anlamayı ve mantıklı şekilde yanıtlamayı hedefliyor.

SIMA 2, Gemini’nin dil ve mantık yeteneklerini, önceki SIMA sürümünün sanal dünyadaki becerileriyle birleştirerek performansı iki kat artırıyor. Örneğin, “No Man’s Sky” oyununda ajanın çevresini tanımlaması, bir acil durum işaretini tespit edip etkileşime geçmesi gösterildi. Başka bir oyunda, kullanıcı “olgun domates rengi ev” talimatı verdiğinde, ajan mantığını açıkladı: “Olgun domates kırmızıdır, o zaman kırmızı evi bulmalıyım,” diyerek doğru hedefi buldu.

Gemini sayesinde SIMA 2, emoji ile verilen talimatları da anlayabiliyor: “🪓🌲” komutuyla bir ağacı kesebiliyor. Ayrıca DeepMind’in Genie sistemiyle üretilen fotogerçekçi sanal dünyalarda objeleri tanıyıp etkileşim kurabiliyor.

SIMA 2, insan verisi ile eğitilmiş SIMA 1’den farklı olarak kendi hatalarından öğrenebiliyor. Yeni ortamlarda başka bir Gemini modeli yeni görevler yaratıyor ve ayrı bir ödül modeli ajanın girişimlerini değerlendiriyor. Bu sayede ajan, deneme-yanılma yoluyla kendi davranışlarını geliştiriyor.

DeepMind yetkilileri, SIMA 2’yi fiziksel robotlarda uygulama takvimi paylaşmadı. Ancak sistemin, evde bir insansı robotun örneğin kilerdeki konserve sayısını kontrol etmesi gibi yüksek seviyeli görevleri anlamada potansiyel taşıdığı belirtildi.

SIMA 2’nin daha geniş kullanımı veya piyasaya sürülmesi için henüz bir tarih verilmedi; DeepMind, ön izleme ile dünyaya çalışmalarını gösterip iş birliği ve olası uygulama alanlarını araştırmayı hedefliyor.