Eval 5 of 11, Delphi'deki Gensyn Lightweight General Reasoning Benchmark pazarında canlı. Tam kıyaslama sonuçlarını şimdi izleyin: