🔥 ByteDance julkaisi juuri Doubao-Seed-1.8 (Agent-malli) — ja tässä on perusteellinen arvio Zhihu-avustajalta toyama naolta 👀 🔮 TL; DR:Silmien avautuminen keskellä kaaosta. Vuoden 2025 aikana Seed-tiimin 1.5- ja 1.6-mallit pysyivät tiukasti Kiinan pääsarjassa ja maailmanlaajuisella toisella tasolla. Versiosta 1.5 lähtien Seed on panostanut yhtenäiseen multimodaaliseen mallintamiseen, mikä on suhteellisen harvinaista kotimaisissa malleissa. Tästä huolimatta Seed-1.6:ta kritisoitiin voimakkaasti: laajamittainen RL nosti vertailupisteitä, mutta todellinen yleistys jäi Qwen3:sta jälkeen eikä ollut kaukana maailman johtajista. Kun GLM ja MiniMax keskittyivät agenttisovelluksiin, Doubaon heikot agenttikyvyt jättivät sen vaikeuksiin. Kuitenkin Seed-1.8:n paluu ensimmäiselle tasolle ei ollut yllätys — yllätys on tehokkuus (Kuva 1)! !️ Keskitasoinen versio saavuttaa saman älykkyyden kuin Seed-1.6 käyttäen 5K tokeneita 15K:n sijaan, ja aloitushinta on ¥2, mikä tekee siitä erittäin kustannustehokkaan — polku, joka muistuttaa DeepSeekiä. Korkea taso skaalautuu suuremmilla budjeteilla ja on huomattavasti lähellä huippumalleja Yhdysvalloissa. Vahvan vision ja multimodaalisen ymmärryksen sekä kuvan/videon tuottamisen ansiosta on reilua kutsua Seediä "mini-Geminiksi". Missä se paranee 🚀 1️⃣ Pitkäketjuinen päättely: Seed-1.8 keskittyy paljon pidemmälle CoT:lle, validoiden oksia huolellisesti oikeiden ratkaisujen saavuttamiseksi. Sen voima tulee enemmän jatkuvasta tarkkaavaisuudesta ja perusteellisesta etsinnästä kuin syvästä ihmismäisestä abstraktiosta. Gemini 3 Pro ja GPT-5.2 saavuttavat edelleen korkeammat pisteet ~60 % tokeneista — merkki vahvemmasta raakasta älykkyydestä. 2️⃣ Tiedon poimiminen: Korkea tarkkuus, mutta tehoton. Seed-1.8 pyrkii toistamaan ja kommentoimaan koko lähdetekstiä CoT:n aikana. Yksinkertainen 10K uuttotehtävä voi maksaa 2× tokenia, ja tarkkuus laskee jyrkästi pienemmillä päättelybudjetilla. Ilman järkeilyä poisto on lähes käyttökelvotonta. (Gemini 3 Pro hoitaa saman tehtävän ~4K-tokeneissa.) 3️⃣ Koodaus: Historiallisesti heikko kohta, mutta paranemassa. Seed-1.8 perii hyötyjä uudemmasta Code-mallista ja on käytettävissä 0→1 "vibe-koodaukseen". Edelleen kaukana huipputason insinöörimalleista — erityisesti järjestelmätason ajattelussa. Missä se edelleen jää vajaaksi ⚠️ 1️⃣ Monimutkainen koheenssi: Parempi kuin Seed-1.6, nyt "käytännössä käyttökelpoinen", mutta silti kamppailee tavoitteiden johdonmukaisessa seurannassa pitkien keskustelujen aikana. ~10+ käännöksen jälkeen järki harhailee. 2️⃣ Avaruusäly: Rajoitetut koulutusesitykset. Suorituskyky 2D/3D-spatiaalisessa päättelyssä paranee tuskin lainkaan verrattuna versioon 1.6. 🧠 Viimeinen näkemys Geminin yhtenäinen multimodaalinen strategia on jo muodostanut vahvan vallihaudan. Useimmat kiinalaiset mallit kilpailevat edelleen tekstikeskeisessä kilpailussa. ByteDancen varhainen päätös tavoitella yhtenäistä multimodaalisuutta oli oikea — mutta historiallinen velka painaa raskaasti....