Qwen3.5 може стати першим фронтирним LLM, який розгляне Прокляття Глибини. Схожість за шарами демонструє значно нижчу надлишковість у глибших шарах порівняно з Qwen3. Моя здогадка: з огляду на їхній незвичайний розмір 9B, це або розумна реорганізація шарів (обрізання/заміна/повторне використання), або зміна схеми нормалізації. @Alibaba_Qwen