Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anastasios Nikolas Angelopoulos
Création de LMArena.
Statistiques en boîte noire, évaluation de modèles.
@Berkeley_EECS Ph.D., ancien étudiant chercheur @GoogleDeepMind et ancien élève de @stanford_ee.
Cette mise à jour est vraiment énorme. C'est l'une des plus grandes mises à jour de LMArena cette année !
Code Arena est notre prochaine génération d'évaluations de codage, commençant par des tâches de développement web.
Ici, vous pouvez utiliser des modèles pour créer des sites web interactifs et les partager avec vos amis. Les liens sont persistants, donc vous pouvez par exemple créer un jeu et y jouer quand vous le souhaitez.
Regardez ici deux modèles -- @claudeai Haiku et @grok-Code-Fast -- s'affronter pour construire une galaxie. Dans ce cas, j'ai aimé l'effet "star-wars" de Grok !

lmarena.ai13 nov. 2025
🚀Introducing Code Arena: the next generation of live coding evals for frontier AI models. Built to test how models plan, scaffold, debug, and build real web apps step-by-step.
Try Claude, GPT-5, GLM-4.6 and Gemini in Code Arena today!
143
🏆NOUVEAUX CLASSEMENTS LMARENA🏆
🤓Experts
💻 Services logiciels et informatiques
✍️ Écriture, littérature et langue
🔬 Sciences de la vie, physiques et sociales
🎭 Divertissement, sports et médias
📈 Affaires, gestion et opérations financières
🧮 Mathématiques
⚖️ Droit et gouvernement
🩺 Médecine et soins de santé
Les évaluations de l'utilité économique de l'IA (comme GDPval) sont de plus en plus pertinentes, mais coûteuses à collecter. Nous avons travaillé avec la communauté de LMArena, composée de millions de contributeurs mensuels, pour obtenir des données professionnelles et d'experts de manière organique, résolvant ainsi le problème de l'évolutivité.
>5 % des utilisateurs de LMArena sont des experts, et une grande partie des demandes de LMArena provient d'industries économiquement précieuses : SWE, étudiants/chercheurs, marketeurs/designers, médecins, avocats, et plus encore. Cela nous permet de créer des classements en ligne dans ces catégories, basés sur des retours frais chaque jour. Cela témoigne de la puissance du système de retour d'information du monde réel que nous avons créé chez @arena!


lmarena.ai6 nov. 2025
🚀 Introducing Arena Expert: a new LMArena evaluation framework to identify the toughest, most expert-level prompts from real users, powering a new Expert leaderboard.
We also introduce Occupational Categories that underlie eight new leaderboards:
💻 Software & IT Services
✍️ Writing, Literature, & Language
🔬 Life, Physical, & Social Science
🎭 Entertainment, Sports, & Media
📈 Business, Management, & Financial Ops
🧮 Mathematical
⚖️ Legal & Government
🩺 Medicine & Healthcare
Explore how models perform across fields in thread 🧵 👇

956
Le bureau de LMArena est en effervescence aujourd'hui. L'environnement est superlinéaire. Nous interférons de manière constructive, nous poussant toujours les uns les autres à apprendre et à dépasser ce que nous pensions être nos limites.
Le trait n°1 que nous recherchons lors de l'embauche est "l'Excellence." Produire un travail chaque jour qui répond à la plus haute norme technique en termes de savoir-faire, de performance et de fiabilité. Il y a d'autres facteurs aussi, mais ne jamais faire de compromis sur l'excellence. En conséquence, chacun dans notre équipe est un expert approfondi. Cela est nécessaire pour construire des évaluations de qualité avec confiance.
L'excellence engendre l'excellence. Personne ne veut travailler dans un environnement avec une bande de mouillés -- cela tue l'élan. Nous élevons constamment la barre, et c'est ce qui conduit à ce sentiment d'énergie. C'est rare.
Si vous êtes intéressé à travailler dans ce genre d'environnement, envoyez-moi un DM. Nous recherchons toujours des personnes capables d'élever la barre d'un cran.
124
Meilleurs
Classement
Favoris
