Naprawdę świetna robota od @carlobaronio @pmmarsella @ybenpan! Przed agentami wieloetapowymi jeszcze długi horyzont :)
Cognition
Cognition7 maj 2025
Nasi stażyści prezentują: Kevin-32B = K(ernel D)evin Jest to pierwszy otwarty model wytrenowany przy użyciu RL do pisania jąder CUDA. Wdrożyliśmy wieloetapowy RL przy użyciu GRPO (w oparciu o QwQ-32B) na zbiorze danych KernelBench. Przewyższa najlepsze modele rozumowania (o3 i o4-mini)! 🧵
5,85K