Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jasper
Co-fondatore e CEO @Hyperbolic_Labs. ex-@avax ed ex-@citsecurities. Ha terminato il dottorato di ricerca in matematica in 2 anni @UCBerkeley. Medaglia d'oro alle Olimpiadi di matematica. Massima onorificenza @PKU1898
Entusiasta di essere il primo a ospitare il miglior modello di codifica Qwen3-Coder su @huggingface! Grazie per la vostra fiducia, @Alibaba_Qwen @JustinLin610 @huybery 💜

Yuchen Jin11 ore fa
Ora stiamo servendo Qwen3-Coder-480B-A35B e Qwen3-235B-A22B-2507 su Hyperbolic!
Qwen3-Coder-480B ottiene risultati comparabili a Claude Sonnet 4 nei benchmark di codifica, davvero incredibile!
@JustinLin610 e @huybery sono la gang 420 in Cina, continuate a spedire modelli fino alle 6 del mattino ora cinese!
LFG, AI open-source! 💪

1,22K
Che fine settimana selvaggio riguardo all'IA e all'IMO. Ripensando agli ultimi 3 giorni, ho assistito a:
> Venerdì pomeriggio: informazioni trapelate su DeepMind che vince l'oro
> Sabato 1am: OpenAI ha anticipato l'annuncio ufficiale, rubando la scena
> Inizialmente pensavo che Google fosse solo lento a causa dell'approvazione del marketing
> Poi ho sentito da persone di Google che IMO e loro stessi avevano bisogno di ulteriore tempo per la verifica
> Si scopre che OpenAI non ha nemmeno coinvolto ufficialmente IMO
> Lunedì: DeepMind ha confermato il loro oro con risposte più pulite ed estetiche, completamente verificate dall'IMO
È stato divertente essere il primo a condividere la notizia su X venerdì scorso. Che fine settimana selvaggio!
Scherzi a parte, c'è molto entusiasmo attorno all'IA matematica ultimamente, ma ciò di cui abbiamo più bisogno è rigore e standardizzazione. Come ha sottolineato Terence Tao, anche se i risultati sembrano simili, le differenze nel formato di test possono fare una grande differenza. Siamo ancora lontani dall'avere standard e messaggi chiari e coerenti nella ricerca sull'IA.
Se vogliamo un progresso significativo, è tempo che la comunità faccia un passo avanti. Costruiamo benchmark di cui possiamo tutti fidarci.

Jasper19 lug, 06:25
Solo 20 minuti fa, il risultato dell'IMO 2025 è stato pubblicato.
La Cina si è classificata al primo posto e @GoogleDeepMind ha vinto una medaglia d'oro 🥇
Le future competizioni matematiche saranno tra la squadra cinese e la squadra cinese degli USA contro l'IA.

4,78K
DeepMind ha ottenuto una medaglia d'oro all'IMO venerdì pomeriggio. Ma hanno dovuto aspettare che il marketing approvasse il tweet — fino a lunedì.
@OpenAI ha condiviso il proprio per primo alle 1 del mattino di sabato e ha rubato la scena.
In questo gioco, la velocità > burocrazia. Perdi il momento, perdi la narrazione.
215,04K
Appena uscito dal lavoro e ho provato Grok-4 su un problema di topologia per studenti universitari. Ha impiegato 9 minuti a pensare e poi ha dato con sicurezza una risposta pulita, plausibile, ma totalmente sbagliata 😅
Non penso che questo possa essere considerato "abilità avversariale". I modelli di intelligenza artificiale stanno schiacciando i benchmark — ma c'è ancora molta strada da fare per una vera AGI matematica.



Elon Musk10 lug, 16:47
Grok 4 è arrivato al punto in cui sostanzialmente non sbaglia mai le domande di esame di matematica/fisica, a meno che non siano abilmente avversariali.
Può identificare errori o ambiguità nelle domande, quindi correggere l'errore nella domanda o rispondere a ciascuna variante di una domanda ambigua.
663,06K
Grok ha ottenuto il punteggio massimo all'AIME 🤯 Abbiamo sicuramente bisogno di un benchmark matematico migliore per l'IA ora.


xAI10 lug, 12:01
Presentiamo Grok 4, il modello di intelligenza artificiale più potente al mondo. Guarda la diretta ora:
3,06K
Principali
Ranking
Preferiti
On-chain di tendenza
Di tendenza su X
Principali fondi recenti
Più popolari