O Qwen3.5 pode ser o primeiro LLM de fronteira a enfrentar a Maldição da Profundidade. A sua similaridade camada a camada mostra uma redundância muito menor nas camadas mais profundas em comparação com o Qwen3. O meu palpite: dado o seu tamanho incomum de 9B, ou alguma reorganização inteligente das camadas (poda/troca/reutilização) ou uma mudança no esquema de normalização. @Alibaba_Qwen