MiroThinker 1.5'e derinlemesine baktım, ajan sıkıştırma yöntemi biraz kötü ama anlıyorum ve gerçekten faydalı olduğunu düşünüyorum. Çekirdek, "400 araç kullanımlarını 256K bağlamında nasıl sıkıştırılır" sorununu çözer. Çok cesur bir şey yaptılar: ReAct tarihindeki düşünce-eylem-gözlem yönteminde Gözlem'i fiziksel olarak maskelediler (araç sonucu geri döndürüyor). Son K turu hariç, orijinal metnin korunması hariç, önceki yüzlerce Araç Sonucunun tamamı "Araç sonucu tokenları kaydetmek için atıldı" cümlesiyle değiştirildi. Ama hepsi sağlam <thought>tutuluyor. Bunun çok ters bir kısmı var, bu ajan kendisi derin araştırma yapıyor, bu yüzden sadece son K turunun, yani 5. turun orijinal metnini elinde tutuyor ve önünde kimse yok, soruya nasıl cevap verebilir? Bunun çok belirsiz ama kritik bir önermesi var: düşünce yeterince yoğun olduğu sürece, aslında Özet'e sonsuz bir şekilde yaklaşıyor. Her Düşünce nesli esasen mevcut gözlem için modelden alınan bir bilgi dilimidir. T1 üretildiğinde, O1'deki anahtar veriler zaten beyne "yenilmişti". O1 yerine geçici bir tutucu getirilirken, T1 kaldı. T1, O1'in "bilgi sıkıştırma paketi" haline gelir. Ek bir Özet Ajanı eklemeye gerek yoktur, bu tam Düşünce zinciri kendisi sürekli olarak güncellenen yüksek güvenilirlikte bir "dinamik özet"tir.