Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anastasios Nikolas Angelopoulos
Bygga LMArena.
Black-box-statistik, modellutvärdering.
@Berkeley_EECS Ph.D., tidigare studentforskare @GoogleDeepMind och @stanford_ee alun.
Den här releasen är helt jävla enorm. Det är en av de största uppdateringarna av LMArena i år!
Code Arena är vår nästa generation av kodningsutvärderingar, som börjar med webbutvecklingsuppgifter.
Här kan du använda modeller för att bygga interaktiva webbplatser och dela dem med dina vänner. Länkarna är beständiga, så du kan t.ex. bygga ett spel och spela det när du vill.
Här kan du se två modeller – @claudeai Haiku och @grok-Code-Fast – tävla om att bygga en galax. I det här fallet gillade jag "star-wars"-effekten av Grok!

lmarena.ai13 nov. 2025
🚀Vi presenterar Code Arena: nästa generation av livekodningsevals för avancerade AI-modeller. Byggd för att testa hur modeller planerar, bygger, felsöker och bygger riktiga webbappar steg för steg.
Prova Claude, GPT-5, GLM-4.6 och Gemini i Code Arena idag!
172
🏆NYA TOPPLISTOR🏆 FÖR LMARENA
🤓Experter
💻 Mjukvara och IT-tjänster
✍️ Skrivande, litteratur och språk
🔬 Livs-, fysik- och samhällsvetenskap
🎭 Underhållning, sport och media
📈 Företag, Ledning och Finansiell Verksamhet
🧮 Matematisk
⚖️ Juridik och myndigheter
🩺 Medicin & Sjukvård
Utvärderingar av AI:s ekonomiska användbarhet (som GDPval) är allt mer relevanta, men dyra att samla in. Vi arbetade med LMArenas community med miljontals månatliga bidragsgivare för att hämta yrkes- och expertdata organiskt, för att lösa skalbarhetsproblemet.
>5 % av LMArena-användarna är experter, och en stor andel av LMArena-uppmaningarna finns i ekonomiskt värdefulla branscher: SWE, studenter/forskare, marknadsförare/designers, läkare, advokater med flera. Detta gör det möjligt för oss att bygga topplistor online i dessa kategorier som bygger på ny feedback varje dag. Det talar om kraften i det verkliga feedbacksystemet som vi har skapat på @arena!


lmarena.ai6 nov. 2025
🚀 Vi presenterar Arena Expert: ett nytt LMArena-utvärderingsramverk för att identifiera de tuffaste uppmaningarna på expertnivå från riktiga användare, vilket ger kraft åt en ny experttopplista.
Vi introducerar också yrkeskategorier som ligger till grund för åtta nya topplistor:
💻 Mjukvara och IT-tjänster
✍️ Skrivande, litteratur och språk
🔬 Livs-, fysik- och samhällsvetenskap
🎭 Underhållning, sport och media
📈 Företag, Ledning och Finansiell Verksamhet
🧮 Matematisk
⚖️ Juridik och myndigheter
🩺 Medicin & Sjukvård
Utforska hur modeller presterar mellan fält i tråden 🧵 👇

989
LMArena-kontoret surrar idag. Miljön är superlinjär. Vi lägger oss i på ett konstruktivt sätt, pressar alltid varandra att lära oss och överskrida vad vi trodde var våra gränser.
Egenskapen #1 som vi letar efter när vi anställer är "Excellence". Producerar arbete varje dag som uppfyller den högsta tekniska ribban när det gäller hantverk, prestanda och tillförlitlighet. Det finns andra faktorer också, men kompromissa aldrig med excellens. Som en konsekvens är alla i vårt team djupa experter. Detta krävs för att bygga kvalitetsutvärderingar med tillförsikt.
Förträfflighet föder förträfflighet. Ingen vill arbeta i en miljö med en massa våta filtar – det dödar drivkraften. Vi höjer hela tiden ribban, och det är det som leder till känslan av energi. Det är sällsynt.
Om du är intresserad av att arbeta i den här typen av miljö, skicka mig ett DM. Vi letar alltid efter personer som kan höja ribban ett snäpp högre.
165
Topp
Rankning
Favoriter
