Qwen3.5 có thể là LLM biên giới đầu tiên giải quyết Lời nguyền độ sâu. Sự tương đồng theo lớp của nó cho thấy độ dư thừa thấp hơn nhiều ở các lớp sâu hơn so với Qwen3. Dự đoán của tôi: với kích thước 9B không bình thường của chúng, có thể là một số tổ chức lại lớp thông minh (cắt tỉa/thay thế/tái sử dụng) hoặc một sự thay đổi trong sơ đồ chuẩn hóa. @Alibaba_Qwen