Gördüğüm kadarıyla Grok 4.2 için hiç kıyaslama yok, değil mi? Gördüğüm diğer tüm ön sürüm modellerinde en azından bazı kıyaslamalar vardı. Kusurlu olsalar bile (ve benchmarklar hatalı olsa bile), modelin denemeye değer olabilecek görevleri görmenize yardımcı olurlar.