Deep Blue, 1997’de satrançta Garry Kasparov’u yenmeden Evvel bile, masa oyunları Yapay zekaların muvaffakiyetlerinin Temel bir ölçüsüydü. 2015’te AlphaGo, Go ustası Lee Sedol’u yendiğinde Öbür bir Mani daha aşılmıştı. Bu oyunların her ikisi de nispeten net bir analitik kurallar dizisine sahip ve mümkünlük temelli yaklaşımlar, bu oyunların temelinde yatıyor.
Cicero, Diplomacy’de insan düzeyinde performans sergiliyor
Geliştirilen Cicero yapay zekası, webDiplomacy.net‘te Diplomacy’nin çevrimiçi bir sürümünü oynayarak eğitildi. Cicero Vakit içerisinde oyunda ustalaşarak insan oyuncuların “ortalama puanının iki katından fazlasını” elde etmeyi başardı.
Meta, Cicero’yu oluşturmak için stratejik akıl yürütme (AlphaGo’ya benzer) ve doğal lisan işleme (GPT-3’e benzer) için Yapay zeka modellerini bir ortaya getirdi ve bunları Biricik bir aracıda topladı. Her oyun sırasında Cicero, oyun tahtasının durumunu, sohbet geçmişlerini ve diğer oyuncuların nasıl davranacağını tahlil ederek ilerliyor. Cicero insan gibisi diyaloglar oluşturabildiği için öteki oyuncularla koordineli bir biçimde çalışabilir ve planını uyguluyor.
Meta, Cicero’nun doğal lisan hünerlerini, “kontrol edilebilir bir diyalog modeli” olarak tanımlıyor. GPT-3 üzere, Cicero da web’den elde edilen kütüphaneleri kullanıyor. Meta, Cicero’nun eğitimine 2,7 milyar parametreli BART gibisi bir lisan modeliyle başladıklarını da belirtiyor.
Cicero, strateji içinde strateji geliştiriyor
Meta araştırmacılarının belirttiği üzere Cicero’nun yetenekleri ve stratejileri epey ayrıntılı. Aktarılanlara nazaran Cicero, oyunun ilerleyen kısımlarında makul bir oyuncunun dayanağına muhtaçlık duyacağını anlayabiliyor ve o kişinin gözüne girmek için farklı bir strateji oluşturuyor. Hatta o oyuncunun karşılaşabileceği riskleri ve fırsatları da ayrım edip konum alabiliyor.
Cicero’nun geleceği uygun de olabilir Üzücü de
Daha geniş uygulamalara gelince, Meta, Cicero araştırmasının beşerler ortasındaki “iletişim mahzurlarını hafifletebileceğini” öne sürüyor. Yahut eğitim alanlarında hatta oyunlardaki daha gerçekçi NPC’ler için kullanılabileceği belirtiliyor. Bu sayede oyuncunun motivasyonuna Ahenk sağlanabilir.
Aynı vakitte bu teknoloji, insanları manipüle etmek için kullanılabilir. Bu doğrultuda Meta, öteki araştırmacıların kendi kodunu “sorumlu bir şekilde” oluşturabileceklerini umuyor ve “bu yeni alandaki zehirli mesajları” tespit etmek ve kaldırmak için adımlar attığını söylüyor. Meta’nın buradaki “adımlar”dan kastı muhtemelen internet metinlerinden öğrenilen diyaloglar. Aka lisan modellerini internet data tabanıyla oluşturmak bu üzere Olumsuz riskleri içeriyor. nihayet olarak Meta’nın Cicero’nun nasıl çalıştığını açıklamak için bir web sitesi yayına aldı ve ayrıyeten Cicero’nun kodunu GitHub‘da Aleni kaynaklı hale getirdi.
Yorum Yok