Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anastasios Nikolas Angelopoulos
Aufbau von LMArena.
Black-Box-Statistiken, Modellbewertung.
@Berkeley_EECS Ph.D., ehemaliger studentischer Forscher @GoogleDeepMind und @stanford_ee Alumnus.
Dieses Update ist verdammt riesig. Es ist eines der größten Updates für LMArena in diesem Jahr!
Code Arena ist unsere nächste Generation von Programmierbewertungen, beginnend mit Aufgaben zur Webentwicklung.
Hier kannst du Modelle verwenden, um interaktive Websites zu erstellen und sie mit deinen Freunden zu teilen. Die Links sind persistent, sodass du z.B. ein Spiel erstellen und es spielen kannst, wann immer du willst.
Hier sieh dir zwei Modelle an -- @claudeai Haiku und @grok-Code-Fast -- die gegeneinander antreten, um eine Galaxie zu bauen. In diesem Fall mochte ich den "Star-Wars"-Effekt von Grok!

lmarena.ai13. Nov. 2025
🚀Introducing Code Arena: the next generation of live coding evals for frontier AI models. Built to test how models plan, scaffold, debug, and build real web apps step-by-step.
Try Claude, GPT-5, GLM-4.6 and Gemini in Code Arena today!
140
🏆NEUE LMARENA LEITERLISTEN🏆
🤓Experten
💻 Software- & IT-Dienstleistungen
✍️ Schreiben, Literatur & Sprache
🔬 Lebens-, Physik- & Sozialwissenschaften
🎭 Unterhaltung, Sport & Medien
📈 Wirtschaft, Management & Finanzoperationen
🧮 Mathematik
⚖️ Recht & Regierung
🩺 Medizin & Gesundheitswesen
Bewertungen des wirtschaftlichen Nutzens von KI (wie GDPval) sind immer relevanter, aber teuer zu sammeln. Wir haben mit der LMArena-Community von Millionen monatlicher Mitwirkender zusammengearbeitet, um berufliche und Expertendaten organisch zu beschaffen und das Skalierbarkeitsproblem zu lösen.
>5 % der LMArena-Nutzer sind Experten, und ein großer Teil der LMArena-Anfragen stammt aus wirtschaftlich wertvollen Branchen: SWE, Studenten/Forscher, Vermarkter/Designer, Ärzte, Anwälte und mehr. Dies ermöglicht es uns, Online-Leiterlisten in diesen Kategorien zu erstellen, die täglich auf frischem Feedback basieren. Es spricht für die Kraft des realen Feedbacksystems, das wir bei @arena geschaffen haben!


lmarena.ai6. Nov. 2025
🚀 Introducing Arena Expert: a new LMArena evaluation framework to identify the toughest, most expert-level prompts from real users, powering a new Expert leaderboard.
We also introduce Occupational Categories that underlie eight new leaderboards:
💻 Software & IT Services
✍️ Writing, Literature, & Language
🔬 Life, Physical, & Social Science
🎭 Entertainment, Sports, & Media
📈 Business, Management, & Financial Ops
🧮 Mathematical
⚖️ Legal & Government
🩺 Medicine & Healthcare
Explore how models perform across fields in thread 🧵 👇

953
Das LMArena-Büro ist heute voller Leben. Die Atmosphäre ist superlinear. Wir beeinflussen uns konstruktiv, indem wir uns ständig gegenseitig anspornen, zu lernen und unsere vermeintlichen Grenzen zu überschreiten.
Die wichtigste Eigenschaft, die wir bei der Einstellung suchen, ist "Exzellenz." Jeden Tag Arbeit zu leisten, die den höchsten technischen Standards in Bezug auf Handwerkskunst, Leistung und Zuverlässigkeit entspricht. Es gibt auch andere Faktoren, aber bei Exzellenz darf man niemals Kompromisse eingehen. Infolgedessen ist jeder in unserem Team ein tiefgehender Experte. Dies ist erforderlich, um qualitativ hochwertige Bewertungen mit Vertrauen zu erstellen.
Exzellenz zieht Exzellenz nach sich. Niemand möchte in einer Umgebung arbeiten, die von Nörglern geprägt ist – das killt den Schwung. Wir setzen ständig die Messlatte höher, und das führt zu einem Gefühl von Energie. Das ist selten.
Wenn du daran interessiert bist, in einer solchen Umgebung zu arbeiten, schick mir eine DM. Wir suchen immer nach Menschen, die die Messlatte noch ein Stück höher legen können.
121
Top
Ranking
Favoriten
