Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Google'ın bu yeni makalesinde çok küçük bir bulgu.
Akıl yürütme modelleri, karmaşık görevlerde komut ayarlı modelleri geride bırakır.
Yaygın açıklama, uzun test süresi hesaplamasının daha uzun düşünce zincirleriyle gerçekleştiğidir.
Ancak bu yeni araştırma daha derin bir şeyi ortaya çıkarıyor.
Geliştirilmiş akıl yürütmenin, modelin kendisi içinde çoklu ajan benzeri etkileşimlerin örtük simülasyonundan ortaya çıktığını öne sürer.
Araştırmacılar buna "düşünce toplumu" diyor.
DeepSeek-R1 ve QwQ-32B'den alınan mantık izlerinin nicel analizi sayesinde, bu modellerin temel modellere göre çok daha fazla perspektif çeşitliliği sergilediğini buldular.
Akıl yürütme sırasında heterojen kişilik ve uzmanlık ile ilgili özellikler arasında daha geniş bir çatışmayı tetikler.
Bu nasıl görünüyor?
Konuşma davranışları arasında soru-cevaplama dizileri, bakış açısı değişimleri, bakış açıları arasındaki çatışmalar ve anlaşmazlıkların uzlaştırılması bulunur.
Model, keskin bir karşılıklı konuşmayı karakterize eden belirgin sosyo-duygusal roller benimseyerek kendi tartışmalarıyla tartışır.
DeepSeek-R1, DeepSeek-V3'e kıyasla önemli ölçüde daha fazla soru-cevaplama, bakış açısı değişimi ve uzlaşma gösteriyor. Aynı desen QwQ-32B ile Qwen-2.5-32B-IT için de geçerlidir. Komuta ayarlı modeller tek taraflı monologlar üretir. Akıl yürütme modelleri simüle edilmiş diyalog üretir.
Başarılı akıl yürütme modelleri, yanlış cevaplara yol açan "yankı odası"ndan kaçınır. Farklı bakış açıları arasında anlaşmazlığı simüle ederek, yanıltıcı ilk iddialara karşı uyumu önlerler.
Kontrollü Gerçek Düzen deneyleri, temel modellerin yalnızca akıl yürütme doğruluğu nedeniyle ödüllendirildiğinde kendiliğinden sohbet davranışları geliştirdiğini göstermektedir.
Konuşma iskeleleriyle ince ayarlanmış modeller, özellikle erken eğitim aşamalarında, monolog benzeri akıl yürütme ile ince ayarlananlardan daha hızlı öğrenir.
...

En İyiler
Sıralama
Takip Listesi
