Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Noam Brown
Pesquisando @OpenAI de raciocínio | Cocriou IAs de poker sobre-humanas Libratus/Pluribus, CICERO Diplomacy AI e modelos de raciocínio OpenAI o3 / o1 / 🍓
Pode ser difícil "sentir a AGI" até que você veja uma IA dominar um domínio que você se importa profundamente. Todos terão seu momento Lee Sedol em tempos diferentes.

Dave White22/07, 08:59
as notícias do openai IMO me atingiram bastante pesado neste fim de semana
ainda estou na fase aguda do impacto, eu acho
considero-me um matemático profissional (uma caracterização com a qual alguns matemáticos profissionais reais podem ter problemas, mas a minha festa, as minhas regras) e não acho que consigo responder a uma única pergunta do imo
ok, sim, imo é sua própria pequena subseção atlética da matemática para a qual não treinei, etc. etc., mas. se eu encontrar alguém na vida real que tenha uma medalha de ouro do IMO, eu imediatamente atualizo para "esta pessoa é muito melhor em matemática do que eu"
agora um monte de robôs pode fazer isso. como alguém que tem muito da sua identidade e da sua vida real construídas em torno de "é bom em matemática", é um soco no estômago. é uma espécie de morte.
como, um dia você descobre que pode falar com cães. é divertido e interessante, então você faz isso mais, aprendendo as complexidades da língua deles e seus costumes mais profundos. você aprende que outras pessoas ficam surpresas com o que você pode fazer. você nunca se encaixou exatamente, mas aprende que as pessoas apreciam sua habilidade e querem que você esteja por perto para ajudá-las. os cães também apreciam você, o único bípede que realmente entende. você monta para si mesmo uma espécie de pertencimento. então, um dia você acorda e o tradutor universal de cães está à venda no walmart por $4,99
o resultado do IMO não é exatamente uma novidade. na verdade, se você olhar para o gráfico de comprimento da tarefa do agente METR ao longo do tempo, eu acho que os agentes serem capazes de resolver problemas de ~ 1,5 horas está vindo bem a tempo. então, de certa forma, não deveríamos nos surpreender. e, de fato, parece que várias empresas alcançaram o mesmo resultado. é apenas... a maré crescente subindo tão rápido quanto tem subido
claro, o luto pela minha identidade pessoal como matemático (e/ou membro produtivo da sociedade) é a menor parte desta história
multiplique esse luto por *cada* matemático, por cada programador, talvez por cada trabalhador do conhecimento, cada artista... ao longo dos próximos anos... é uma história um pouco maior
e, claro, além disso, há o medo da morte real, sobre o qual talvez eu fale mais tarde.
este pacote -- luto pela relevância, luto pela vida, luto pelo que conheci -- não é único da era da IA ou algo assim. eu acho que é uma coisa padrão à medida que se aproxima do fim da carreira ou do fim da vida. pode apenas ser que isso esteja chegando um pouco mais cedo para muitos de nós, todos de uma vez.
eu me pergunto se estamos prontos
143,79K
Parabéns à equipa GDM pelo seu resultado no IMO! Acho que o sucesso paralelo deles destaca a rapidez do progresso da IA. A abordagem deles foi um pouco diferente da nossa, mas acho que isso mostra que existem muitas direções de pesquisa para um progresso adicional. Algumas reflexões sobre o nosso modelo e resultados 🧵
386,15K
A aposta deles permitiu sistemas de IA matemática formais (como o AlphaProof). Em 2022, quase ninguém achava que um LLM poderia estar ao nível do ouro IMO até 2025.

Nat McAleese19/07, 17:47
Estamos a ver um progresso em IA muito mais rápido do que **Paul Christiano** e **Yudkowsky** previram, que tinham ouro em 2025 a 8% e 16% respetivamente, por métodos que são mais gerais do que o esperado.
164,35K
Levamos alguns meses a transformar a fronteira da pesquisa experimental num produto. Mas o progresso é tão rápido que alguns meses podem significar uma grande diferença nas capacidades.

Ravid Shwartz Ziv19/07, 09:17
Então, todos os modelos têm um desempenho inferior ao dos humanos nas novas questões da Olimpíada Internacional de Matemática, e o Grok-4 é especialmente ruim nisso, mesmo com a seleção do melhor de n? Inacreditável!

128,37K
Sheryl (@sherylhsu02) foi a nossa primeira contratação para a equipe de múltiplos agentes. Dentro de poucos meses após a sua entrada, ela ajudou a tornar isso possível. Temos tanta sorte de tê-la na equipe!

Sheryl Hsu19/07, 15:52
Assistir o modelo resolver esses problemas do IMO e alcançar um desempenho de nível ouro foi mágico. Algumas reflexões 🧵
114,36K
Hoje, nós da @OpenAI alcançámos um marco que muitos consideravam a anos de distância: desempenho ao nível de medalha de ouro na IMO 2025 com um LLM de raciocínio geral—dentro dos mesmos limites de tempo que os humanos, sem ferramentas. Por mais notável que isso pareça, é ainda mais significativo do que o título 🧵
1,07M
Top
Classificação
Favoritos
Tendências on-chain
Popular no X
Principais financiamentos atuais
Mais notável