PMPP-Eval-oppdatering! Opon utgivelse av K2-Thinking, jeg har evaluert den og par andre modeller som ble forespurt, for eksempel R1 og Qwen3 235B over pmpp-eval koding delsett. K2-Thinking er nå den beste åpne modellen som er tilgjengelig, ifølge resultater som overgår sonett 4.5 for cuda-oppgaver.