Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🔥 ByteDance julkaisi juuri Doubao-Seed-1.8 (Agent-malli) — ja tässä on perusteellinen arvio Zhihu-avustajalta toyama naolta 👀
🔮 TL; DR:Silmien avautuminen keskellä kaaosta.
Vuoden 2025 aikana Seed-tiimin 1.5- ja 1.6-mallit pysyivät tiukasti Kiinan pääsarjassa ja maailmanlaajuisella toisella tasolla. Versiosta 1.5 lähtien Seed on panostanut yhtenäiseen multimodaaliseen mallintamiseen, mikä on suhteellisen harvinaista kotimaisissa malleissa.
Tästä huolimatta Seed-1.6:ta kritisoitiin voimakkaasti: laajamittainen RL nosti vertailupisteitä, mutta todellinen yleistys jäi Qwen3:sta jälkeen eikä ollut kaukana maailman johtajista. Kun GLM ja MiniMax keskittyivät agenttisovelluksiin, Doubaon heikot agenttikyvyt jättivät sen vaikeuksiin.
Kuitenkin Seed-1.8:n paluu ensimmäiselle tasolle ei ollut yllätys — yllätys on tehokkuus (Kuva 1)! !️
Keskitasoinen versio saavuttaa saman älykkyyden kuin Seed-1.6 käyttäen 5K tokeneita 15K:n sijaan, ja aloitushinta on ¥2, mikä tekee siitä erittäin kustannustehokkaan — polku, joka muistuttaa DeepSeekiä.
Korkea taso skaalautuu suuremmilla budjeteilla ja on huomattavasti lähellä huippumalleja Yhdysvalloissa. Vahvan vision ja multimodaalisen ymmärryksen sekä kuvan/videon tuottamisen ansiosta on reilua kutsua Seediä "mini-Geminiksi".
Missä se paranee 🚀
1️⃣ Pitkäketjuinen päättely:
Seed-1.8 keskittyy paljon pidemmälle CoT:lle, validoiden oksia huolellisesti oikeiden ratkaisujen saavuttamiseksi.
Sen voima tulee enemmän jatkuvasta tarkkaavaisuudesta ja perusteellisesta etsinnästä kuin syvästä ihmismäisestä abstraktiosta. Gemini 3 Pro ja GPT-5.2 saavuttavat edelleen korkeammat pisteet ~60 % tokeneista — merkki vahvemmasta raakasta älykkyydestä.
2️⃣ Tiedon poimiminen:
Korkea tarkkuus, mutta tehoton. Seed-1.8 pyrkii toistamaan ja kommentoimaan koko lähdetekstiä CoT:n aikana. Yksinkertainen 10K uuttotehtävä voi maksaa 2× tokenia, ja tarkkuus laskee jyrkästi pienemmillä päättelybudjetilla. Ilman järkeilyä poisto on lähes käyttökelvotonta. (Gemini 3 Pro hoitaa saman tehtävän ~4K-tokeneissa.)
3️⃣ Koodaus:
Historiallisesti heikko kohta, mutta paranemassa. Seed-1.8 perii hyötyjä uudemmasta Code-mallista ja on käytettävissä 0→1 "vibe-koodaukseen". Edelleen kaukana huipputason insinöörimalleista — erityisesti järjestelmätason ajattelussa.
Missä se edelleen jää vajaaksi ⚠️
1️⃣ Monimutkainen koheenssi:
Parempi kuin Seed-1.6, nyt "käytännössä käyttökelpoinen", mutta silti kamppailee tavoitteiden johdonmukaisessa seurannassa pitkien keskustelujen aikana. ~10+ käännöksen jälkeen järki harhailee.
2️⃣ Avaruusäly:
Rajoitetut koulutusesitykset. Suorituskyky 2D/3D-spatiaalisessa päättelyssä paranee tuskin lainkaan verrattuna versioon 1.6.
🧠 Viimeinen näkemys
Geminin yhtenäinen multimodaalinen strategia on jo muodostanut vahvan vallihaudan. Useimmat kiinalaiset mallit kilpailevat edelleen tekstikeskeisessä kilpailussa. ByteDancen varhainen päätös tavoitella yhtenäistä multimodaalisuutta oli oikea — mutta historiallinen velka painaa raskaasti....

Johtavat
Rankkaus
Suosikit
