Meituan představuje OneThinker, komplexní model vizuálního uvažování
Tento obecný MLLM sjednocuje porozumění obrazu a videu napříč 10 různorodými úkoly, jako jsou otázky a odpovědi, uzemnění, sledování a segmentace. Dosahuje vysokého výkonu díky EMA-GRPO pro multitaskové RL.
Tým agentů OPPO AI se ptá, jak daleko jsme od skutečně užitečných agentů hlubokého výzkumu
Představujeme FINDER, nový benchmark se 100 úkoly kurátorsky vybranými lidmi, a DEFT, první taxonomii neúspěchů pro agenty hlubokého výzkumu.
Mistral právě vydal Mistral Large 3 na Hugging Face!
Jejich nový špičkový multimodální model Mixture-of-Experts nabízí 41B aktivních parametrů,
Celkem 675B, a obrovské kontextové okno 256k pro výkon ve Frontieru.