Google DeepMind’in Yeni Atılımı: Gemini Robotics
Google DeepMind, robotları daha akıllı ve yetenekli hale getirecek olan Gemini Robotics adlı yeni yapay zeka modelini tanıttı. Bu yenilikçi sistem, artık yalnızca ekran başında etkileşimde bulunmakla kalmayacak, fiziksel dünyada da çeşitli görevleri yerine getirebilecek. Gemini 2.0 altyapısıyla geliştirilen bu yenilik, robotların basit “şunu al, şunu koy” gibi görevlerinin ötesine geçerek daha karmaşık işlerin üstesinden gelmesine yardımcı olmayı hedefliyor.
Gemini Robotics, VLA – Vision-Language-Action (Görsel-Dil-Hareket) modeli olarak tasarlanmış. Bu model, yapay zekanın yalnızca görsel ve metinsel verileri işlemekle kalmayıp, aynı zamanda fiziksel hareketleri de yönetebilmesi için geliştirildi. Böylece robotlar, nesneleri tanıyabilir, verilen komutları anlayarak uygun tepkiler verebilir hale geliyor.
Yeni yapay zeka modelinin en dikkat çekici özelliklerinden biri, günlük dilde verilen talimatlara uyum sağlayabilmesi ve farklı dillerde çalışabilmesidir. Google, Gemini Robotics’i genel etkileşim yeteneği, hassasiyet ve kullanım kolaylığı gibi üç temel prensip üzerine inşa ettiğini belirtti. Sistem, daha önce karşılaşmadığı nesneleri ve ortamları tanıma yeteneğine sahipken, kullanıcıdan gelen komutlara hızlı ve etkili yanıtlar verebiliyor.
Robotlar, insan ellerine benzer bir hassasiyetle nesneleri manipüle edebilme becerisine de sahip. Örneğin, bir kahve kupasını kulpundan tutarak kaldırabilir veya kilitli bir poşete atıştırmalık yerleştirebilir. Bu tür yetenekler, robotların günlük yaşamda daha aktif rol alabilmelerini sağlıyor.
Şirket ayrıca, Gemini Robotics-ER adını verdiği yeni bir modeli de tanıttı. Bu model, uzamsal algılama ve bedensel akıl yürütme yeteneğini geliştirerek robotların nesneleri güvenli bir şekilde kavrama ve hareket etme becerisini artırıyor. Farklı robot türleriyle uyumlu çalışabilen sistem, Agility Robotics, Boston Dynamics ve Enchanted Tools gibi tanınmış şirketler tarafından test edildi.
Kaynak: Webtekno