Koreli bir yapay zeka girişimi olan Trillion Labs, Yapay Analiz Zeka Endeksi'nde 20 puan alan küçük bir açık ağırlıklı akıl yürütme modeli Tri-21B-think Preview'u başlattı Temel kıyaslama çıkarımları: ➤ Küçük boyutu için yüksek ama önde değil zeka: Tri-21B-think Önizleme, nispeten küçük 21 milyar parametre boyutuyla yüksek puan alıyor. Modelin sadece 21B olması, GLM-5 ve Kimi K2.5 gibi önde gelen açık kaynak modellere kıyasla kendi kendine hoste için nispeten daha erişilebilir kılıyor ➤ Düşük halüsinasyon oranı: Tri-21B-think Önizleme Endeksi, sektörler arasında bilgi güvenilirliği ve halüsinasyonları ölçen özel bir Yapay Analiz kıstası olan AA-Omniscience Index'te -49 puan alıyor. Bu iyi puan, karşılaştırdığımız Güney Kore modelleri arasında en düşük olan nispeten düşük halüsinasyon oranından (%62) kaynaklanıyor. ➤ Ajanik Araç Kullanımında Güç: Tri-21B-think Önizleme, τ²-Bench Telecom'da %93 puan alarak ajanik araç kullanım iş akışlarında güçlü performans göstermiştir. Tri-21B-think Preview, bu kategorideki öncü açık ağırlık modelleri arasında yer alıyor ve bu kategoride DeepSeek V3.2 ve MiniMax M2.5 ile benzer puan alıyor ➤ Yüksek Token Kullanımı: Tri-21B-think Önizleme, aynı zeka katmanındaki diğer modellere kıyasla çok yüksek token kullanımı gösteriyor ve Yapay Analiz Zeka paketinde ~120M akıl yürütme tokenı kullanıyor. Bu, başka bir Kore modeli olan K-EXAONE (100M akıl yürütme tokenı) ile karşılaştırılabilir ➤ Açık Uç Noktaları Yok: Tri-21B-think Önizleme, Apache 2.0 lisansı altında açık ağırlıklar modelidir. Şu anda modele erişmenin tek yolu kendi kendine barındırmak. Trillion Labs, yakın gelecekte birinci taraf, özel bir uç nokta hizmetinin beklendiğini paylaştı. Daha fazla analiz için aşağıya bakınız
Tri-21B-think Önizleme τ²-Bench Telecom'da %93 puan alarak ajanik araç kullanım iş akışlarında güçlü performans sergilemektedir.
Tri-21B-think Önizleme, Yapay Analiz Zekası paketinde ~120M mantık belirtisi kullanarak çok yüksek token kullanımı gösteriyor.
9,07K