Çoğu senaryoda insan düzeyinde performans
Microsoft araştırmacıları yapmış oldukları testlerde GPT-4’ün erken sürümünü kullandıklarını belirtiyor. Grup, GPT-4’ün evvelki jenerasyonda Noksan olan bir sıra kategoride insan düzeyine yakın performans elde ettiğini vurguluyor. Bu kategoriler matematik, kodlama, görüş, tıp, hukuk ve psikoloji üzere alanları içeriyor. Makaleye nazaran, ChatGPT (GPT-4) ayrıyeten Çeşitli imtihanlarda (Baro, LSAT vb.) inanılmaz bir performans göstererek birinci yüzde 10’luk dilimde yer aldı. GPT-3.5 modelinin tıpkı testlerde ya zar güç geçer not aldığı ya da en Üzücü yüzde 10’luk dilimde olduğu belirtiliyor.
“GPT-4’ün yeteneklerinin genişliği ve derinliği göz önüne alındığında bunun makul bir formda bir Yapay genel zeka (AGI) sisteminin erken bir versiyonu olarak görülebileceğine inanıyoruz.” ifadelerinin kullanıldığı araştırmada Kasım 2022’de çıkan GPT-3.5’e nazaran sadece birkaç ayda her alanda kaydedilen bu üstel büyümeye dikkat çekiliyor. Fakat makalede eksikliklere de ziyadesiyle değiniliyor.
Bilinçli Yapay zekaya daha var
Yine de araştırmacılar makalede, GPT-4’ün “birçok vazife için insan düzeyinde yahut ötesinde” olmasına karşın, muhakkak “insan gibisi olmadığını” kabul ediyorlar. Yani GPT-4, üstün olduğu vakitlerde bile hala tam olarak bir insan üzere düşünmüyor. Öte yandan daha farklı alanlardaki uzmanlar 2030’lu yıllarda AGI’lere ulaşacağımızı düşünüyor.
Bilim insanları, Yapay zeka sisteminin şuurlu olduğunda ve tıpkı bir insan üzere düşündüğünde AGI’ye ulaşıldığı konusunda hemfikir olsa da bütün çevreler tarafından kabul edilen bir AGI tarifi şimdi yapılmış değil. Hasebiyle GPT-4’ün kimi alanlarda insan düzeyinde yahut daha yeterli performans göstermesi AGI’ye yanlışsız atılmış bir adım olarak ele alınabilir.
Yorum Yok