Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Saya mengadopsi pendekatan Generator-Verifier serupa untuk penggunaan model dalam penelitian fisika teoretis.
Pakar manusia di perbatasan sains dapat meningkatkan model Verifier ke titik bahwa operasi otonom sangat kuat bahkan pada masalah penelitian dunia nyata (bukan hanya masalah kontes matematika yang dibuat-buat = masalah yang diajukan dengan baik yang dapat diselesaikan dalam waktu terbatas oleh manusia).
DeepSeekMathV2
Sinergi Antara Generator dan Verifier
Generator dan verifikator bukti membentuk loop umpan balik yang meningkatkan diri. Saat generator menghasilkan bukti yang semakin kompleks, ini menantang verifikat, mengekspos kelemahan yang menjadi data pelatihan baru. Awalnya, para ahli manusia memandu pelatihan ulang verifikator dengan meninjau masalah yang ditandai — sebuah proses yang dibuat efisien dengan menghasilkan beberapa upaya verifikasi per bukti. "Meta-verifikasi" ini (memeriksa temuan verifikator daripada bukti secara langsung) terbukti lebih mudah bagi manusia dan lebih mudah dipelajari untuk LLM.
Dengan menskalakan jumlah analisis dan pelatihan verifikator pada anotasi yang dibantu AI ini, verifikator akhirnya mencapai tingkat keandalan di mana intervensi manusia tidak lagi diperlukan dalam proses akhir — menutup lingkaran antara pembuatan bukti otomatis dan verifikasi.

28 Nov, 01.26
Wow! DeepSeekMath-V2
Arsitektur Generator-Verifier lagi!
... Menuju penalaran matematis yang dapat diverifikasi sendiri, kami menyelidiki bagaimana melatih verifikator berbasis LLM yang akurat dan setia untuk pembuktian teorema. Kami kemudian melatih generator bukti menggunakan verifikator sebagai model hadiah, dan memberi insentif kepada generator untuk mengidentifikasi dan menyelesaikan masalah sebanyak mungkin dalam bukti mereka sendiri sebelum menyelesaikannya. Untuk mempertahankan kesenjangan verifikasi generasi saat generator menjadi lebih kuat, kami mengusulkan untuk menskalakan komputasi verifikasi untuk secara otomatis memberi label pada bukti baru yang sulit diverifikasi, membuat data pelatihan untuk lebih meningkatkan verifikat. Model kami yang dihasilkan, DeepSeekMath-V2, menunjukkan kemampuan pembuktian teorema yang kuat, mencapai skor tingkat emas pada IMO 2025 dan CMO 2024 dan 118/120 yang hampir sempurna pada Putnam 2024 dengan komputasi waktu pengujian yang diskalakan. Meskipun masih banyak pekerjaan yang tersisa, hasil ini menunjukkan bahwa penalaran matematis yang dapat diverifikasi sendiri adalah arah penelitian yang layak yang dapat membantu mengembangkan sistem AI matematika yang lebih mumpuni.

Ini menjelaskan transisi dari alur Generator-Verifier dasar menggunakan model siap pakai, ke model di mana Verifier itu sendiri telah ditingkatkan melalui data pelatihan ahli manusia yang digunakan dalam meta-verifikasi.

1,97K
Teratas
Peringkat
Favorit
