Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

hardmaru
Construire une @SakanaAILabs 🧠 d’intelligence collective
Pas même en bronze : Évaluation des LLM sur l'Olympiade Internationale de Mathématiques 2025 🥉
Un excellent article de blog de l'équipe derrière MathArena : Évaluation des LLM sur des compétitions mathématiques non contaminées () fournissant une analyse indépendante des performances des LLM sur l'OIM.

42,39K
Pas même en bronze : Évaluation des LLMs lors de l'Olympiade Internationale de Mathématiques 2025 🥉
Un excellent article de blog de l'équipe derrière MathArena :
Évaluation des LLMs sur des compétitions mathématiques non contaminées () fournissant une analyse indépendante des performances des LLM lors de l'IMO.

513
hardmaru a reposté
L'humanité a prévalu (pour l'instant !)
Je suis complètement épuisé. J'ai calculé que j'avais 10 heures de sommeil au cours des 3 derniers jours et je suis à peine en vie.
Je publierai plus d'informations sur le concours quand j'aurai un peu de repos.
(Pour être clair, ce sont des résultats provisoires, mais mon avance devrait être suffisamment grande)

1,98M
hardmaru a reposté
Quelques mises à jour 🚨
J’ai terminé mon doctorat à @uwcse en juin 2025 !
Après une année à AI2 en tant que chercheur scientifique, je rejoindrai CMU @LTIatCMU & @mldcmu (autorisation) en tant que professeur adjoint à l’automne 2026.
Le parcours, les remerciements et le recrutement en 🧵


98,73K
hardmaru a reposté
Il y a 1 décennie : Ingénieur en prompts d'apprentissage par renforcement dans la section 5.3 de « Learning to Think … » [2]. Chaîne de pensée adaptative ! Un réseau d'apprentissage par renforcement apprend à interroger un autre réseau pour le raisonnement abstrait et la prise de décision. Allant au-delà du modèle mondial de 1990 pour une planification milliseconde par milliseconde [1].
[2] J. Schmidhuber (JS, 2015). « On Learning to Think: Algorithmic Information Theory for Novel Combinations of RL Controllers and Recurrent Neural World Models. » ArXiv 1210.0118
[1] JS (1990). “Making the world differentiable: On using fully recurrent self-supervised neural networks for dynamic reinforcement learning and planning in non-stationary environments.” TR FKI-126-90, TUM. (Ce rapport a également introduit la curiosité artificielle et la motivation intrinsèque à travers des réseaux antagonistes génératifs.)

23,37K
hardmaru a reposté
Si vous pensez aux modèles du monde ou aux simulations neuronales et que vous ne savez pas par où commencer, consultez le papier OG sur les modèles du monde de @hardmaru et @SchmidhuberAI
- Il est super clair à lire et permet de comprendre les bases
- Vous pouvez le reproduire sur votre Mac ou n'importe quelle machine locale
- Vous pouvez progressivement l'améliorer pour le rendre encore plus puissant
Si Karpathy devait enseigner les modèles du monde, c'est ce papier dans lequel il plongerait en profondeur.
13,51K
Meilleurs
Classement
Favoris
Tendance on-chain
Tendance sur X
Récents financements de premier plan
Les plus notables