Eval 2 von 11 ist jetzt im Gensyn Lightweight General Reasoning Benchmark-Markt auf Delphi live. Sehen Sie sich jetzt die vollständigen Benchmarking-Ergebnisse an: