Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

EigenPhi HQ 🎯 Wisdom of DeFi (🔭, 🎙) 🦇🔊
Enterprise-AI-Anwendungsfälle sind Bereiche, in denen die Verifizierung oft kompliziert wird. Aber wenn Sie strukturierte Protokolle, wirtschaftliche Absichten oder das Verhalten von Agenten nutzen können, können Sie das Signal verstärken. Lassen Sie uns zusammenarbeiten, um diese verifizierbaren Verhaltensweisen in die Modelltrainingsregime zu integrieren.

Salesforce AI Research24. Sept., 08:57
📣 Variation in Verification: Verständnis der Verifizierungsdynamik in großen Sprachmodellen
📄 Papier:
🔗 Projekt:
Haben Sie sich jemals gefragt, ob Ihr LLM-Verifizierer tatsächlich zuverlässig für Ihre Aufgabe ist? Unser Analyse-Framework zeigt drei Schlüsselfaktoren, die den Verifizierungserfolg über die Problemschwierigkeit, die Fähigkeit des Generators und die Fähigkeit des Verifizierers bestimmen.
Wichtige Erkenntnisse:
📈 Die Problematik treibt die Erkennung korrekter Antworten - Verifizierer sind bei einfachen Problemen hervorragend, haben aber Schwierigkeiten mit schwierigen.
🔍 Die Stärke des Generators beeinflusst die Fehlererkennung - schwache Generatoren produzieren offensichtliche Fehler, starke schaffen elegante, aber falsche Lösungen.
⚖️ Die Skalierung des Verifizierers zeigt abnehmende Erträge in bestimmten Regimen - manchmal schlägt GPT-4o gerade so kleinere Modelle.
💡 Für die Testzeit-Skalierung: schwache Generatoren + Verifizierung können die Leistung starker Generatoren erreichen, und teure Verifizierer sind nicht immer lohnenswert.
Großartige Arbeit von Yefan Zhou @LiamZhou98, Austin Xu @austinsxu, Yilun Zhou @YilunZhou, Janvijay Singh @iamjanvijay, Jiang Gui @JiangGui, Shafiq Joty @JotyShafiq!
#LLM #AIVerification #TestTimeScaling #FutureOfAI #EnterpriseAI

756
Kudos an das TOOL-Team 👏 Ethereum in einen hyperskalierbaren Co-Prozessor zu heben, ist ein Game-Changer. Auf unserer Seite gedeiht die Skalierungsinfrastruktur nur, wenn sie mit transparenten, prüfbaren Daten zur Transaktionsverarbeitung und -priorisierung kombiniert wird. Ohne dies öffnet die niedrige Latenzzeit der Finalität die Tür zur Zentralisierung.

0xprincess24. Sept., 22:26
1// Wir freuen uns, den Start des TOOL Testnets bekannt zu geben!
3,36K
Das Gesetz des Verifiers ist eine großartige Perspektive, Jason. Ich bin neugierig, was du über Bereiche wie Kryptographie oder On-Chain-Daten denkst – wo die Verifizierung fast kostenlos ist, aber die Komplexität der Lösungen explodiert? 💭🔐

Jason Wei16. Juli 2025
Neuer Blogbeitrag über Asymmetrie von Verifikation und "Verifier's Law":
Die Asymmetrie der Verifizierung – die Idee, dass einige Aufgaben viel einfacher zu verifizieren als zu lösen sind – wird zu einer wichtigen Idee, da wir RL haben, das endlich allgemein funktioniert.
Gute Beispiele für Asymmetrie der Verifizierung sind Dinge wie Sudoku-Rätsel, das Schreiben des Codes für eine Website wie Instagram und BrowseComp-Probleme (es werden ~100 Websites benötigt, um die Antwort zu finden, aber es ist einfach, sie zu überprüfen, sobald Sie die Antwort haben).
Andere Aufgaben weisen eine nahezu symmetrische Verifizierung auf, z. B. das Summieren von zwei 900-stelligen Zahlen oder einige Datenverarbeitungsskripte. Bei anderen Aufgaben ist es viel einfacher, praktikable Lösungen vorzuschlagen, als sie zu überprüfen (z.B. einen langen Aufsatz zu überprüfen oder eine neue Diät wie "nur Bisons essen" anzugeben).
Eine wichtige Sache, die Sie über die Asymmetrie der Verifizierung wissen sollten, ist, dass Sie die Asymmetrie verbessern können, indem Sie im Voraus einige Arbeiten durchführen. Zum Beispiel, wenn Sie den Antwortschlüssel für ein mathematisches Problem haben oder wenn Sie Testfälle für ein Leetcode-Problem haben. Dies erhöht die Anzahl der Probleme mit der wünschenswerten Verifikationsasymmetrie erheblich.
Das "Verifier'sche Gesetz" besagt, dass die Leichtigkeit, mit der KI trainiert werden kann, um eine Aufgabe zu lösen, proportional dazu ist, wie überprüfbar die Aufgabe ist. Alle Aufgaben, die lösbar und leicht zu verifizieren sind, werden von der KI gelöst. Die Fähigkeit, KI so zu trainieren, dass sie eine Aufgabe löst, hängt davon ab, ob die Aufgabe die folgenden Eigenschaften hat:
1. Objektive Wahrheit: Alle sind sich einig, was gute Lösungen sind
2. Schnell zu überprüfen: Jede beliebige Lösung kann in wenigen Sekunden überprüft werden
3. Skalierbar zur Verifizierung: Viele Lösungen können gleichzeitig verifiziert werden
4. Geringes Rauschen: Die Verifizierung ist so eng wie möglich mit der Qualität der Lösung korreliert
5. Kontinuierliche Belohnung: Es ist einfach, die Güte vieler Lösungen für ein einzelnes Problem zu bewerten
Eine offensichtliche Instanziierung des Verifizierergesetzes ist die Tatsache, dass die meisten in der KI vorgeschlagenen Benchmarks leicht zu verifizieren sind und bisher gelöst wurden. Beachten Sie, dass praktisch alle populären Benchmarks der letzten zehn Jahre die Kriterien #1-4 erfüllen; Benchmarks, die die Kriterien #1-4 nicht erfüllen, würden es schwer haben, populär zu werden.
Warum ist Überprüfbarkeit so wichtig? Die Menge an Lernen, die in der KI stattfindet, wird maximiert, wenn die oben genannten Kriterien erfüllt sind; Sie können viele Gradientenschritte machen, wobei jeder Schritt viel Signal hat. Die Geschwindigkeit der Iteration ist entscheidend – sie ist der Grund, warum der Fortschritt in der digitalen Welt so viel schneller war als der Fortschritt in der physischen Welt.
AlphaEvolve von Google ist eines der besten Beispiele für die Nutzung der Asymmetrie der Verifizierung. Es konzentriert sich auf Setups, die alle oben genannten Kriterien erfüllen, und hat zu einer Reihe von Fortschritten in der Mathematik und anderen Bereichen geführt. Anders als das, was wir in den letzten zwei Jahrzehnten in der KI gemacht haben, ist es ein neues Paradigma, da alle Probleme in einer Umgebung optimiert werden, in der der Zugsatz dem Testsatz entspricht.
Die Asymmetrie der Verifikation ist allgegenwärtig, und es ist spannend, an eine Welt der zackigen Intelligenz zu denken, in der alles, was wir messen können, gelöst wird.

889
Top
Ranking
Favoriten