🚨GROK OBTEVE 26,9% NO "ÚLTIMO EXAME DA HUMANIDADE" SEM NENHUM FERRAMENTA O gráfico de escalonamento conta a história: mais computação = melhor desempenho. Grok superou mais de um quarto do benchmark acadêmico mais difícil do mundo usando apenas raciocínio puro. Sem calculadoras, sem ajuda externa. Apenas poder cerebral de IA enfrentando 2.500 perguntas em todos os campos do conhecimento humano. A maioria dos humanos falharia neste teste mesmo COM ferramentas. Grok está a fazê-lo de olhos vendados. Fonte: @xai @elonmusk
Mario Nawfal
Mario Nawfal10/07, 12:14
🚨"O ÚLTIMO EXAME DA HUMANIDADE" LANÇADO: 2.500 PERGUNTAS PARA SEPARAR A VERDADEIRA IA DOS IMITADORES O X acaba de revelar o desafio académico definitivo - um padrão tão abrangente que se destina a ser o último teste necessário. A matemática domina com 41%, seguida pelas ciências e humanidades. O nome diz tudo: este é o exame que acaba com todos os exames. Uma vez que a IA passe este teste, o que mais resta provar? Estamos a construir o teste que determina quando as máquinas nos superam oficialmente. Fonte: @xai @elonmusk
89,6K