@vjhofmann ve @allen_ai #COLM2025'den Akışkan LM kıyaslaması Bu makaleyi zaten şilin ettim, harika. Öğe düzeyinde zorluk (IRT modeli) ile, bilgi kazanımını en üst düzeye çıkaran örnekler vererek ham performans yerine bir modelin *gizli yeteneğini* tahmin edebilirsiniz