DeepSeek V4 wyciekł: HumanEval: ~90% (wycieki społecznościowe na Reddit + podsumowania Skywork AI) SWE-bench: „>80%” terytorium (odniesione w postach porównawczych Wavespeed, ekstrapolując z benchmarków Claude Opus) Kontekst: do 1M tokenów (plotki o pakiecie powtórzone w Reddit AI Insider + podsumowania blogów) Koszt: rzekomo 20–40x tańszy niż OpenAI (bazując na porównaniach cen API DeepSeek V3/R1 w stosunku do poziomów modeli frontier) Oczekiwany: 17 lutego (czas na Chiński Nowy Rok szeroko raportowany w wyciekach)
Traktuj te liczby z dużą dozą sceptycyzmu.
19