Alibaba on julkaissut 4 uutta Qwen3.5-mallia kooltaan 0,8B:stä 9B:hen. 9B (Päättely, 32 älykkyysindeksissä) on älykkäin malli 10B-parametrilla, ja 4B (Päättely, 27) älykkäin alle 5B, mutta molemmat käyttävät 200M+ lähtötokeneita Älykkyysindeksin ajamiseen @Alibaba_Qwen on laajentanut Qwen3.5-perhettä neljällä pienemmällä tiheällä mallilla: 9B (Päättely, 32 älykkyysindeksissä), 4B (Päättely, 27), 2B (Päättely, 16) ja 0,8B (Päättely, 9). Nämä täydentävät tämän kuun alussa julkaistuja suurempia 397B-, 27B-, 122B- ja 35B A3B-malleja. Kaikki mallit ovat Apache 2.0 -lisensoituja, tukevat 262K-kontekstia, sisältävät natiivin näkötuen ja käyttävät samaa yhtenäistä ajattelu/ei-ajattelua -hybridilähestymistapaa kuin muu Qwen3.5-perhe Keskeiset vertailutulokset päättelyvarianteille: ➤ 9B ja 4B ovat älykkäimmät mallit omissa kokoluokissaan, edellä kaikkia muita malleja 10B-parametrilla. Qwen3.5 9B (32) saa noin kaksinkertaisen pistemäärän seuraavaksi lähimpiin alle 10B-malleihin verrattuna: Falcon-H1R-7B (16) ja NVIDIA Nemotron Nano 9B V2 (Perustelu, 15). Qwen3.5 4B (27) voittaa kaikki nämä pisteet, vaikka sillä on noin puolet parametreista. Kaikki neljä pientä Qwen3.5-mallia ovat Pareto-rajalla Intelligence vs. Total Parameters -taulukossa ➤ Qwen3.5-sukupolvi edustaa materiaaliälykkyyden nousua Qwen3:een verrattuna kaikissa alle 10B-mallien kokoissa, ja suurempia parannuksia saavutetaan suuremmilla kokonaisparametrimäärillä. Päättelyvarianttien vertailu: Qwen3.5 9B (32) on 15 pistettä edellä Qwen3 VL 8B:tä (17), 4B (27) saa 9 pistettä Qwen3 4B 2507:ään (18), 2B (16) on 3 pistettä edellä Qwen3 1.7B:tä (arviolta 13), ja 0.8B (9) saa 2.5 pistettä Qwen3:n 0.6B:hen (6.5). ➤ Kaikki neljä mallia käyttävät 230–390M output tokeneita Intelligence Indexin ajamiseen, mikä on huomattavasti enemmän kuin sekä suuremmat Qwen3.5-sisarukset että Qwen3:n edeltäjät. Qwen3.5 2B käytti ~390M lähtötokeneita, 4B ~240M, 0.8B ~230M, ja 9B ~260M. Taustaksi: paljon suurempi Qwen3.5 27B käytti 98M:ää ja 397B:n lippulaiva 86M:tä. Nämä tokenien määrät ylittävät myös useimmat rajamallit: Gemini 3.1 Pro Preview (57M), GPT-5.2 (xhigh, 130M) ja GLM-5 Reasoning (109M) ➤ AA-Kaikkitietävyys on suhteellinen heikkous, hallusinaatioiden esiintyvyys on 80–82 % 4B:llä ja 9B:llä. Qwen3.5 4B saa AA-Omnisciencessa -pisteet -57, hallusinaatioprosentti 80 % ja tarkkuus 12,8 %. Qwen3.5 9B saa pisteet -56, hallusinaatiot 82 % ja tarkkuus 14,7 %. Nämä ovat hieman parempia kuin Qwen3:n edeltäjät (Qwen3 4B 2507: -61, 84 % hallusinaatio, 12,7 % tarkkuus), ja parannus johtuu pääasiassa alhaisemmista hallusinaatiotaajuuksista, ei korkeammasta tarkkuudesta. ➤ Qwen3.5:n alle 10B-mallit yhdistävät korkean älykkyyden ja alkuperäisen näön mittakaavassa, jota ei aiemmin ollut saatavilla. MMMU-Prossa (monimodaalinen päättely) Qwen3.5 9B saa 69,2 % ja 4B 65,4 %, edellä Qwen3 VL 8B (56,6 %), Qwen3 VL 4B (52,0 %) ja Ministry 3 8B (46,0 %). Qwen3.5 0.8B saa 25,8 %, mikä on merkittävää alle 1B-mallissa Muuta tietoa: ➤ Konteksti-ikkuna: 262K tokenia ➤ Lisenssi: Apache 2.0 ➤ Kvantisointi: Natiivipainot ovat BF16. Alibaba ei ole julkaissut ensimmäisen osapuolen GPTQ-Int4-kvantisointeja näille pienille malleille, mutta ne ovat julkaisseet aiemmin julkaistuihin Qwen3.5-perheen suuremmille malleille (27B, 35B-A3B, 122B-A10B, 397B-A17B). 4-bittisessä kvantisaatiossa kaikki neljä mallia ovat saatavilla kuluttajalaitteilla ➤ Saatavuus: Julkaisuhetkellä näitä malleja ei ole ensimmäisen tai kolmannen osapuolen palvelimettomia API-rajapintoja, jotka isännöivät näitä malleja
Qwen3.5-sukupolvi on askel muutos pienten mallien älykkyydessä verrattuna Qwen3:een. 9B saa 15 pistettä Qwen3 VL 8B:hen (17–32), 4B saa 9 pistettä Qwen3 4B 2507:ään (18–27), 2B saa 3 pistettä Qwen3 1,7B:hen (13–16) ja 0,8B 2,5 pistettä Qwen3 0,6B:hen (6,5–9).
Älykkyyden parannukset tulevat korkean tokenin käytön kustannuksella verrattuna vertaisiin. Kaikki neljä alle 10B Qwen3.5-mallia käyttävät 230M+ lähtötokeneita Intelligence Indexin ajamiseen – tämä on huomattavasti korkeampi kuin useimmissa Frontier-malleissa sekä Qwen3:n edeltäjissä
Qwen3.5, 9B- ja 4B-mallit ovat älykkäimpiä multimodaalisia malleja 15B-parametrilla. MMMU-Pro:ssa Qwen3.5 9B (69 %) ja 4B (65 %) johtavat kaikkia alle 15B-malleja
Yksittäisten tulosten erittely kaikille neljälle mallille
Vertaa Qwen3.5-perhettä muihin johtaviin malleihin seuraavasti:
8,56K