Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🔥 ByteDance heeft zojuist Doubao-Seed-1.8 (Agent model) uitgebracht — en hier is een diepgaande evaluatie van Zhihu-bijdrager toyama nao 👀
🔮 TL;DR: Een oogopener te midden van chaos.
Gedurende 2025 bleven de modellen 1.5 en 1.6 van het Seed-team stevig in de top van China en de tweede wereldwijde tier. Sinds 1.5 heeft Seed zich sterk gericht op uniforme multimodale modellering, een relatief zeldzame inzet onder binnenlandse modellen.
Dat gezegd hebbende, Seed-1.6 kreeg veel kritiek: grootschalige RL verhoogde benchmark scores, maar de generalisatie in de echte wereld bleef achter bij Qwen3 en was ver verwijderd van wereldleiders. Terwijl GLM en MiniMax zich richtten op Agent-toepassingen, lieten Doubao's zwakke agentcapaciteiten het worstelen.
Echter, de terugkeer van Seed-1.8 naar de eerste tier was geen verrassing — de verrassing is efficiëntie (Fig 1)‼️
De medium versie bereikt dezelfde intelligentie als Seed-1.6 met 5K tokens in plaats van 15K, tegen een instapprijs van ¥2, wat het extreem kosteneffectief maakt — een pad dat doet denken aan DeepSeek.
De hoge tier schaalt redenering met grotere budgetten en komt opmerkelijk dicht bij de topmodellen uit de VS. Met sterke visie & multimodaal begrip, plus beeld/video generatie die slechts een halve stap achterblijft — het is eerlijk om Seed een "mini-Gemini" te noemen.
Waar het verbetert 🚀
1️⃣ Langdurige redenering:
Seed-1.8 behoudt de focus over veel langere CoT, zorgvuldig takken validerend om de juiste oplossingen te bereiken.
De kracht komt meer van volgehouden aandacht en uitputtende zoektochten dan van diepe mensachtige abstractie. Gemini 3 Pro en GPT-5.2 behalen nog steeds hogere scores met ~60% van de tokens — een teken van sterkere rauwe intelligentie.
2️⃣ Informatie-extractie:
Hoge nauwkeurigheid, maar inefficiënt. Seed-1.8 heeft de neiging om de volledige brontekst te herhalen en te annoteren tijdens CoT. Een eenvoudige extractietaak van 10K kan 2× tokens kosten, en de nauwkeurigheid daalt scherp bij lagere redeneringsbudgetten. Zonder ingeschakelde redenering is extractie bijna onbruikbaar. (Gemini 3 Pro verwerkt dezelfde taak in ~4K tokens.)
3️⃣ Codering:
Historisch een zwak punt, maar verbetert. Seed-1.8 erft winst van het recente Code-model en is bruikbaar voor 0→1 "vibe coding". Nog steeds ver verwijderd van top-tier engineeringmodellen — vooral in systeemniveau denken.
Waar het nog tekortschiet ⚠️
1️⃣ Multi-turn coherentie:
Beter dan Seed-1.6, nu "basically usable", maar worstelt nog steeds om consistent doelen te volgen over lange gesprekken. Na ~10+ rondes drijft de redenering af.
2️⃣ Ruimtelijke intelligentie:
Beperkte training toont zich. De prestaties op 2D/3D ruimtelijke redenering verbeteren nauwelijks ten opzichte van 1.6.
🧠 Eindoordeel
Gemini's uniforme multimodale strategie heeft al een sterke vesting gevormd. De meeste Chinese modellen zijn nog steeds vergrendeld in tekstgerichte concurrentie. ByteDance's vroege beslissing om uniforme multimodaliteit na te streven was juist — maar historische schulden wegen zwaar....

Boven
Positie
Favorieten
