Ürpertici itiraf: ChatGPT’yi yapan firma bile nasıl çalıştığını bilmiyor

Yazılım May 12, 2023 Yorum Yok

Büyük lisan modelleri (LLM) teknoloji dünyasını fethederken, yapay zeka (AI) araştırmacıları hala kaputun altındaki fonksiyonellikleri ve yetenekleri hakkında Fazla Çok şey bilmiyorlar. OpenAI, yayınlanan makalesinin birinci cümlesinde “Dil modelleri daha yetenekli hale geldi ve daha yaygın olarak kullanılmaya başlandı, ancak nasıl çalıştıklarını anlamıyoruz” diyerek bunu açıkça itiraf ediyor.

Neden çalıştıklarını bilmiyoruz

Ancak bir hudut ağının ferdi nöronlarının çıktılarını üretmek için Bir arada nasıl çalıştığını tam olarak “bilmeme” durumunun uygun bilinen bir ismi bulunuyor: Kara kutu. Yani, var durumda Yapay zeka sistemlerinden bir şeyler istiyoruz ve onlar da bir bizlere bir yanıt veriyor, Ama bu iki süreç ortasındaki süreçte (kara kutu) ne olduğu bir gizem.

Kara kutunun içine bakmak emeliyle OpenAI’daki araştırmacılar GPT-4 lisan modelini kullanarak GPT-2 üzere Fazla daha az karmaşık bir lisan modelindeki nöronların davranışları için doğal lisan açıklamaları oluşturdu ve kıymetlendirdi. Teoride, yorumlanabilir bir AI modeline sahip olmak, bu sistemlerin istendiği bir formda çalışmasına katkıda bulunabilir.

Çalışma formları anlaşılabilirse eksiklikleri giderilebilir

OpenAI araştırmacıları, Yapay zeka modelleri daha gelişmiş hale geldikçe, üretilen açıklamaların kalitesinin artacağını ve bu karmaşık sistemlerin İç işleyişine dair daha yeterli bilgiler sunacağını umuyor. OpenAI, araştırma makalesini, her adımın Örnek dökümlerini içeren, metnin vurgulanan kısımlarını ve bunların makul nöronlara nasıl karşılık geldiğini gösteren etkileşimli bir web sitesinde yayınladı. Firma çalışmalarına devam edeceğini belirtiyor.

Eğer “yorumlanabilirlik” alanında istenen muvaffakiyet sağlanırsa o Vakit ChatGPT ve oburlarının neden bir şeyler uydurduğunu anlayabilir ve bu kritik Sorun çözülebilir. Çünkü bu, tıpkı insanların hastalandıklarında tedavi edilmeleri üzere bir süreç. Bir meselemiz varsa hastaneye sarfiyat muayene olur ve teşhis konulur. Teşhis konulunca da buna nazaran ilaç verilir. Şimdilik yapay zeka modellerini Kesin doğrulukla “muayene” edemiyoruz.