Небольшое обновление PMPP-Eval для только что выпущенного Intellect-3 от @PrimeIntellect По моим личным тестам было очевидно, что он превосходит вариант Air (который использует ту же базовую модель), цифры это подтверждают с разницей +34% по сравнению с Air и на уровне с GLM-4.5 размером 3x.