"122B muss schlauer sein als 27B" Ich habe 4 UI-Komponenten drei Qwen3.5-Modellen gezeigt und sie gebeten, diese nur anhand eines Screenshots nachzustellen: - 27B (dicht) - 35B-A3B (MoE) - 122B-A10B (MoE) Gleicher Screenshot. Gleiche Eingabeaufforderung. Gleiche Aufgabe. Welcher von ihnen hat deiner Meinung nach das Beste gemacht?