Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Noam Brown
Ricerca ragionamento @OpenAI | Ha co-creato le IA di poker superumane Libratus/Pluribus, CICERO Diplomacy AI e OpenAI o3 / o1 / 🍓 modelli di ragionamento
Può essere difficile "sentire l'AGI" finché non vedi un'IA padroneggiare un dominio che ti sta molto a cuore. Ognuno avrà il proprio momento Lee Sedol in tempi diversi.

Dave White22 lug, 08:59
le notizie di openai IMO mi hanno colpito piuttosto forte questo fine settimana
sono ancora nella fase acuta dell'impatto, penso
mi considero un matematico professionista (una caratterizzazione con cui alcuni veri matematici professionisti potrebbero avere delle obiezioni, ma la mia festa, le mie regole) e non penso di poter rispondere a una sola domanda dell'IMO
ok, sì, l'IMO è la sua piccola sottosezione atletica della matematica per cui non mi sono allenato, ecc. ecc., ma. se incontro qualcuno nella vita reale che ha un oro all'IMO, aggiorno immediatamente a "questa persona è molto migliore di me in matematica"
ora un sacco di robot possono farlo. come qualcuno che ha gran parte della propria identità e della propria vita costruita attorno a "è bravo in matematica", è un colpo al cuore. è una sorta di morire.
come, un giorno scopri di poter parlare con i cani. è divertente e interessante, quindi lo fai di più, imparando le complessità della loro lingua e le loro usanze più profonde. scopri che altre persone sono sorprese da ciò che puoi fare. non ti sei mai sentito del tutto a tuo agio, ma impari che le persone apprezzano la tua abilità e vogliono che tu sia presente per aiutarle. anche i cani ti apprezzano, l'unico bipede che capisce davvero. ti costruisci una sorta di appartenenza. poi un giorno ti svegli e il traduttore universale per cani è in vendita da walmart per $4.99
il risultato dell'IMO non è esattamente una notizia. in effetti, se guardi il grafico della lunghezza del compito dell'agente METR nel tempo, penso che gli agenti in grado di risolvere problemi di ~ 1,5 ore stia arrivando proprio in tempo. quindi in un certo senso non dovremmo essere sorpresi. e infatti, sembra che più aziende abbiano raggiunto lo stesso risultato. è solo... la marea crescente che sta salendo così velocemente
certo, il lutto per la mia identità personale come matematico (e/o membro produttivo della società) è la parte più piccola di questa storia
moltiplica quel lutto per *ogni* matematico, per ogni programmatore, forse ogni lavoratore della conoscenza, ogni artista... nei prossimi anni... è una storia leggermente più grande
e naturalmente, oltre a ciò, c'è la paura della morte reale, di cui forse parlerò di più in seguito.
questo pacchetto -- lutto per la rilevanza, lutto per la vita, lutto per ciò che ho conosciuto -- non è unico per l'era dell'AI o qualcosa del genere. penso che sia una cosa standard quando ci si avvicina alla fine della carriera o alla fine della vita. potrebbe solo essere che questo stia arrivando un po' prima per molti di noi, tutti insieme.
mi chiedo se siamo pronti
97,61K
Congratulazioni al team GDM per il loro risultato IMO! Penso che il loro successo parallelo evidenzi quanto sia veloce il progresso dell'IA. Il loro approccio era un po' diverso dal nostro, ma penso che questo dimostri che ci sono molte direzioni di ricerca per ulteriori progressi. Alcune riflessioni sul nostro modello e sui risultati 🧵
357,06K
La loro scommessa ha permesso sistemi di intelligenza artificiale matematica formale (come AlphaProof). Nel 2022, quasi nessuno pensava che un LLM potesse essere a livello oro IMO entro il 2025.

Nat McAleese19 lug, 17:47
Stiamo vedendo progressi nell'IA molto più rapidi di quanto previsto da **Paul Christiano** e **Yudkowsky**, che avevano stimato un aumento dell'oro nel 2025 dell'8% e del 16% rispettivamente, attraverso metodi più generali del previsto.
164,31K
Ci vogliono alcuni mesi per trasformare il confine della ricerca sperimentale in un prodotto. Ma i progressi sono così rapidi che pochi mesi possono significare una grande differenza nelle capacità.

Ravid Shwartz Ziv19 lug, 09:17
Quindi, tutti i modelli sottoperformano rispetto agli esseri umani sulle nuove domande delle Olimpiadi Internazionali di Matematica, e Grok-4 è particolarmente scarso, anche con la selezione best-of-n? Incredibile!

128,35K
Sheryl (@sherylhsu02) è stata la nostra prima assunzione nel team multi-agente. Dopo pochi mesi dal suo ingresso, ha contribuito a rendere tutto ciò possibile. Siamo così fortunati ad averla nel team!

Sheryl Hsu19 lug, 15:52
Guardare il modello risolvere questi problemi IMO e raggiungere prestazioni a livello oro è stato magico. Alcuni pensieri 🧵
114,34K
Oggi, noi di @OpenAI abbiamo raggiunto un traguardo che molti consideravano lontano anni: prestazioni da medaglia d'oro al 2025 IMO con un LLM di ragionamento generale—sotto gli stessi limiti di tempo degli esseri umani, senza strumenti. Per quanto straordinario possa sembrare, è ancora più significativo di quanto riportato nel titolo 🧵
1,07M
Principali
Ranking
Preferiti
On-chain di tendenza
Di tendenza su X
Principali fondi recenti
Più popolari