De Lightweight General Reasoning Benchmark-markt is officieel van start gegaan. Eval 1 van 11 is live op Delphi. Bekijk nu de volledige benchmarkresultaten: