Qwen3.5 zou wel eens het eerste frontier LLM kunnen zijn dat de Curse of Depth aanpakt. De laag-voor-laag gelijkenis toont veel lagere redundantie in diepere lagen vergeleken met Qwen3. Mijn gok: gezien hun ongebruikelijke grootte van 9B, ofwel een slimme herschikking van lagen (snoeien/wisselen/hergebruiken) of een verandering in het normalisatieschema. @Alibaba_Qwen