Daha fazla kanıt olan LLM'ler bilinçli değildir ve herhangi bir bilgiyi genellemezler, bu yüzden genel olarak zeki olmayacaklar, ama aslında (hâlâ son derece faydalı) eğitimli istatistiksel yanıtlayıcılardır.
Lossfunk
Lossfunk19 Mar 22:14
🚨 Şok edici: Frontier LLM'leri standart kodlama benchmarklarında %85-95 puan alıyor. Ezberleyemedikleri dillerde eşdeğer problemler verdik. Düşüşler %0-11'e düştü. EsoLang-Bench'i sunuyorum. ICLR 2026'da 🧵 Mantıksal Akıl ve ICBINB atölyelerine kabul edildi
Bilgisayar bilimi mezunlarına, daha önce görmedikleri dillerde + biraz sözdizimi ile kodlama görevleri veriliyor ve sürekli tekrarlamadıklarını kanıtlamak için Fibonacci dizisini kodlamaları isteniyor Ve bu insanları ayırıyor, ama %90 değil
53