X

OpenAI, insan gibi bir düşünce zinciri oluşturan dil modeli istiyor

OpenAI, AI’nin (yapay zeka) doğru olmayan şeyler uydurduğu yaygın “halüsinasyon sorununu” ortadan kaldırmada yaptığı bazı ilerlemeleri özetleyen yeni bir makale yayınladı. Makale, halüsinasyonları ve nasıl ortaya çıktıklarını belirleyip temizlemek için kullanılan sonuç denetimi ve süreç denetimi olarak adlandırılan iki modeli özetiyor.

Ödül modelleri, OpenAI’nin sonuç denetimi modelinde yapay zekanın verdiği nihai sonuç hakkında geri bildirim sağlamak için eğitiliyor. Süreç denetiminde ise ödül modeli, insan benzeri bir düşünce zinciri oluşturarak izlenen yolun her adımında geri bildirim sağlar.

OpenAI’nin araştırma makalesinde belirttiğine göre, her iki model de bir matematik veri kümesi üzerinde test edildi ve süreç denetim yönteminin “önemli ölçüde daha iyi performans sağladığı” bulundu. Ancak süreç denetimi yönteminin şu ana kadar yalnızca matematik alanında test edildiğini ve genel bilgi alanında nasıl performans gösterdiğini görmek için daha fazla çalışma gerekeceğini belirtmek önemli olabilir.

Süreç denetim yönteminin olası sonuçlarını açıklayan OpenAI, “Bu sonuçlar genelleştirilirse, süreç denetiminin bize her iki seçeneğin en iyi özelliklerini bir araya getiren bir model – sonuç denetiminden hem daha iyi performans gösteren hem de daha uyumlu bir yöntem – sunduğunu görebiliriz” dedi.

Bu adım adım doğrulamanın halüsinasyonları daha genel olarak ortadan kaldırmaya ne kadar yardımcı olacağını söylemek için henüz çok erken gibi gözüküyor. Ancak halüsinasyonların şu anda LLM’lerin muhtemelen en büyük sorunu olduğu düşünülürse, umarız etkili bir çözüm olacaktır.

OpenAI, halka açık olan ChatGPT hizmetinde süreç denetimine ne zaman geçileceği konusunda bir tahminde bulunmadı. Yeni yöntem halen araştırma aşamasında bulunuyor ve genel bilgiler üzerinde test edilmesi gerekiyor.

OpenAI, ilk sonuçlar iyi olsa da daha güvenli yöntemlerin uyum zorluğu adı verilen düşük performansa neden olabileceğinden bahsediyor. Sonuçlar, şu ana kadar süreç denetiminin matematik problemleri üzerinde çalışırken böyle bir performans düşüşü yaşamadığını öneriyor, ancak daha genel bilgilerde sonucun nasıl olacağını henüz bilmiyoruz.

Kaynak: Chip

Dijital Pazarlama Haberleri: Dijital pazarlama için güncel dijital medya haberlerini birden fazla kaynaktan izinli yayınlayan platform.
Related Post