L'évaluation 5 sur 11 est en direct dans le marché Gensyn Lightweight General Reasoning Benchmark sur Delphi. Consultez maintenant les résultats complets du benchmarking :