Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Artificial Analysis
Nezávislá analýza modelů AI a poskytovatelů hostingu - vyberte si nejlepší model a poskytovatele API pro váš případ použití
FLUX.2 [dev] je nový vedoucí model s otevřenou váhou text-to-obraz, který překonal HunyuanImage 3.0, Qwen-Image a HiDream-I1-Dev v oblasti umělé analýzy obrazů!
Nejnovější vydání @bfl_ml si nárokuje první místo v generování textu na obrázek s otevřenými váhami, přičemž zároveň je na #2 v úpravě obrázků s otevřenými váhami, hned za Qwen Image Edit 2509 od Alibaby.
FLUX.2 [dev] je vydán pod licencí FLUX [dev] Non-Commercial s váhami dostupnými na @huggingface. Komerční aplikace vyžadují samostatnou licenci od Black Forest Labs.
Model je dostupný přes API na @fal, @replicate, @runware, Verda, @togethercompute, @Cloudflare a @DeepInfra.
Black Forest Labs také oznámila FLUX.2 [klein], který bude vydán pod licencí Apache 2.0, což umožní vývojářům a firmám vytvářet komerční aplikace bez samostatných licenčních požadavků od Black Forest Labs

1,73K
DeepSeek V3.2 je #2 nejinteligentnější model otevřených vah a také předčí Grok 4 a Claude Sonnet 4.5 (Thinking) – vyvádí DeepSeek Sparse Attention z "experimentálního" stavu a kombinuje ho s materiálním zvýšením inteligence
@deepseek_ai V3.2 získává 66 bodů v Indexu umělé analytické inteligence; výrazné zvýšení inteligence oproti DeepSeek V3.2-Exp (+9 bodů) vydanému v září 2025. DeepSeek přešel na svůj hlavní API endpoint na verzi 3.2, bez změny ceny oproti V3.2-Exp – to znamená, že cena je pouze $0.28/$0.42 za 1M vstupních/výstupních tokenů, s 90% slevou na cacheované vstupní tokeny.
Od původního vydání DeepSeek V3 před ~11 měsíci koncem prosince 2024 se architektura DeepSeek V3 s celkovými parametry 671B a aktivními parametry 37B posunula od modelu s hodnocením 32 na 66 v indexu umělé analytické inteligence.
DeepSeek také vydal verzi 3.2-Speciale, variantu založenou pouze na uvažování s vylepšenými schopnostmi, ale výrazně vyšším spotřebováním tokenů. To je běžný kompromis v modelech uvažování, kde rozšířenější uvažování obvykle přináší vyšší skóre inteligence a více výstupních tokenů. V3.2-Speciale je dostupný přes první stranu API DeepSeek do 15. prosince.
V3.2-Speciale aktuálně dosahuje nižších výsledků v Indexu umělé analýzy inteligence (59) než V3.2 (Uvažování, 66), protože první strana API DeepSeek zatím nepodporuje nástroje vyžadující tento model. Pokud by V3.2-Speciale dosáhl skóre tau2 (91 %) V3.2 s povoleným voláním nástrojů, dosáhl by skóre ~68 v Indexu inteligence, což z něj činí nejinteligentnější model s otevřenými váhami. V3.2-Speciale používá 160 milionů výstupních tokenů pro provoz Indexu umělé analytické inteligence, což je téměř ~2x více tokenů než V3.2 v režimu uvažování.
DeepSeek V3.2 používá stejnou architekturu jako V3.2-Exp, který zavedl DeepSeek Sparse Attention (DSA) ke snížení výpočetní náročnosti potřebné pro dlouhou kontextovou inferenci. Naše benchmark Long Context Reasoning neprokázal žádné náklady pro inteligenci při zavádění DSA. DeepSeek odrážel tuto nákladovou výhodu V3.2-Exp snížením cen svého first party API z 0,56/$1,68 na 0,28/0,42 $ za 1M vstupní/výstupních tokenů – což představuje 50% a 75% snížení cen vstupních a výstupních tokenů.
Klíčové poznatky z benchmarkingu:
➤ 🧠 DeepSeek V3.2: V režimu uvažování získává DeepSeek V3.2 66 v indexu umělé analytické inteligence a je na stejné úrovni jako Kimi K2 Thinking (67) a před Grok 4 (65), Grok 4.1 Fast (Reasoning, 64) a Claude Sonnet 4.5 (Thinking, 63). Ukazuje výrazné zlepšení oproti V3.2-Exp (57) v používání nástrojů, dlouhém kontextovém uvažování a kódování.
➤ 🧠 DeepSeek V3.2-Speciale: V3.2-Speciale dosahuje vyšších skóre než V3.2 (Uvažování) v 7 z 10 benchmarků v našem Intelligence Indexu. V3.2-Speciale nyní drží nejvyšší a druhé nejvyšší skóre ze všech modelů pro AIME25 (97 %) a LiveCodeBench (90 %). Jak bylo však zmíněno výše, první strana API DeepSeek pro verzi 3.2-Speciale nepodporuje volání nástrojů a model získává skóre 0 v benchmarku tau2.
➤ 📚 Halucinace a Znalosti: DeepSeek V3.2-Speciale a V3.2 jsou nejlépe hodnocené modely s otevřenými váhami na indexu Artificial Analysis Omniscience Index s hodnocením -19 a -23. Proprietární modely od Google, Anthropic, OpenAI a xAI obvykle vedou tento index.
➤ ⚡ Výkon bez uvažování: V režimu bez uvažování získává DeepSeek V3.2 52 na indexu umělé analytické inteligence (+6 bodů vs. V3.2-Exp) a je #3 nejinteligentnějším modelem bez uvažování. DeepSeek V3.2 (Bez rozumování) odpovídá inteligenci modelu DeepSeek R1 0528, který je z května 2025 frontier a zdůrazňuje rychlé zisky inteligence dosažené díky předškolení a zlepšení reálného života v tomto roce.
➤ ⚙️ Efektivita tokenů: V režimu uvažování použil DeepSeek V3.2 více tokenů než V3.2-Exp k provozu Artificial Analysis Intelligence Index (z 62M na 86M). Používání tokenů zůstává podobné i v nerozumové variantě. V3.2-Speciale vykazuje výrazně vyšší využití tokenů, využívá tokeny s výstupem ~160M před Kimi K2 Thinking (140M) a Grok 4 (120M)
➤💲Ceny: DeepSeek neaktualizoval ceny za token u svých first-party tokenů a všechny tři varianty jsou dostupné za 0,28 $/0,42 $ za 1 milion vstupních/výstupních tokenů
Další detaily modelu:
➤ ©️ Licencování: DeepSeek V3.2 je dostupný pod licencí MIT
➤ 🌐 Dostupnost: DeepSeek verze 3.2 je dostupná přes DeepSeek API, které nahradilo DeepSeek V3.2-Exp. Uživatelé mají přístup k DeepSeek V3.2-Speciale prostřednictvím dočasného DeepSeek API až do 15. prosince. Vzhledem k zvýšení inteligence v této verzi očekáváme, že tento model brzy nabídne řada třetích stran.
➤ 📏 Velikost: DeepSeek V3.2 Exp má celkem 671B parametrů a 37B aktivních parametrů. To je stejné jako u všech předchozích modelů v řadách DeepSeek V3 a R1

67,04K
The Whisper-Thunder Reveal: Runway Gen-4.5 je nyní vedoucím modelem Text to Video v žebříčcích umělé analýzy videí, čímž překonal Veo 3, Kling 2.5 Turbo a Sora 2 Pro!
Runway Gen-4.5 je nejnovější vydání z roku @runwayml, které navazuje na Runway Gen-4 vydanou v březnu. Zatímco Gen-4 podporovala pouze převod obrazu na video, Runway Gen-4.5 zavádí generování textu na video. Schopnosti generování obrazu na video Runway Gen-4.5 jsme zatím nevyhodnotili.
Runway Gen-4.5 se postupně zavádí uživatelům aplikace Runway a v následujících dnech se očekává širší dostupnost.
Níže naleznete srovnání mezi Runway Gen-4.5 a dalšími předními modely v naší oblasti 🧵 umělých analýz

9,65K
Top
Hodnocení
Oblíbené

