Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Obrázek pro pochopení nového modelu DeepSeek, DeepSeek-Math-V2!
DeepSeek právě vydal DeepSeek-Math-V2!
Ano, jedná se o doménově specifický model matematického uvažování, tentokrát založený na DeepSeek-V3.2 pro post-trénování/doladění, což znamená, že DeepSeek zcela přešel na novou architekturu.
Co se týče výkonů, IMO 2025 (Mezinárodní matematická olympiáda) dosáhla 83,3 % a dosáhla úrovně zlatých medailí IMO. ProofBench-Basic se přímo vylepšil, dosáhl 99 %, čímž překonal všechny ostatní modely. ProofBench-Advanced je druhý nejvíc po Gemini Deep Think (jedná se o platformu s agentem, ne o čistý model).
Mimochodem, letošní IMO 2025 je také první v naší zemi. Pak jsem průměroval skóre DeepSeek-Math-V2 83,3 % přímo na každou otázku a skóre by mělo být 210 z 252 s přesností 83,3 %, což může být mezi Spojenými státy (216 bodů) a Jižní Koreou (203 bodů), tedy 3. místo.

Top
Hodnocení
Oblíbené

