Z tego, co widzę, nie ma żadnych benchmarków dla Grok 4.2, prawda? Każdy inny model przedpremierowy, który widziałem, miał przynajmniej jakieś benchmarki. Nawet jeśli są wadliwe (a benchmarki są wadliwe), pomagają zobaczyć zadania, dla których model może być wart wypróbowania.