Ini sebenarnya adalah suara yang sangat kuat untuk Grok. Saya telah memeriksa dan tampaknya ya, itu memperbaiki batas bawah dalam makalah probabilitas 2025 yang serius. Multi-agen dengan pencarian dan eksekusi kode, tetapi mengapa melumpuhkan diri Anda sendiri jika Anda benar-benar dapat menggunakan alat? DS (hanya web) gagal/menyerah.
Paata Ivanisvili
Paata Ivanisvili18 Feb 2026
Grok 4.20 (Beta) meningkatkan batas bawah sebesar 9,1% pada perimeter Gaussian set cembung dalam dua menit. Ini adalah sesuatu yang ditunjukkan kepada saya oleh Xinyuan Xie. Kembali pada tahun 1993, Keith Ball menunjukkan bahwa keliling Gaussian dari benda cembung dalam ruang Euclidean n-dimensi dibatasi dari atas oleh 4n^{1/4}. Adapun batas bawah, Ball menunjukkan bahwa untuk kubus (dengan ukuran yang sesuai) kelilingnya dapat tumbuh sebagai \sqrt{\log(n)}. Jadi ada celah untuk sementara waktu tentang ikatan mana yang tajam, sampai tahun 2003, ketika, dalam sebuah makalah yang indah, Fedor Nazarov menunjukkan bahwa pada contoh polihedron acak (persimpangan banyak setengah ruang acak) batas bawah dapat tumbuh sebagai C n^{1/4}, dengan C=\exp(-5/4)=0,286.... Selain itu, Nazarov juga meningkatkan konstanta 4 di batas atas (menggantinya dengan 0,64) ketika n besar. Batas-batas ini tetap tak terkalahkan sampai saat ini, ketika pada tahun 2019 Martin Raic berhasil meningkatkan faktor konstanta batas atas dari 0,64 menjadi 0,59. Grok 4.20 (Beta), dengan lebih hati-hati mengoptimalkan konstruksi Nazarov, berhasil meningkatkan konstanta batas bawah dari 0.286 menjadi 0.3126. Saya menemukan ini mengejutkan bahkan jika itu hanya bermain dalam teknik makalah Nazarov, karena baru-baru ini Nadimpalli--Pascale (2025) memposting pracetak di mana, dengan pendekatan yang berbeda, mereka memulihkan batas bawah Nazarov dengan faktor konstanta yang sama 0,286.... Grok sangat murah hati dalam tanggapannya: ia mengatakan bahwa perbaikan yang diberikannya mengikuti argumen yang sama dari Nazarov "baris demi baris", sedangkan ketika saya meminta model lain (selain Grok) untuk memverifikasi klaim Grok, mereka menyetujui segala sesuatu kecuali bagian ini; Mereka mengatakan peningkatan itu tidak benar-benar "baris demi baris" :D. Akhirnya, saya tidak akan mengatakan bahwa Nazarov melewatkan peningkatan ini. Mengenalnya untuk waktu yang lama, saya cukup yakin bahwa adalah hal yang umum baginya untuk mengorbankan konstanta optimal untuk keanggunan aljabar. Mengapa semua ini menarik? Memiliki kontrol atas perimeter Gaussian memungkinkan seseorang untuk mengontrol ekor Fourier dari fungsi karakteristik himpunan ini, yang mengarah pada pengendalian kompleksitas waktu pembelajaran PAC dan algoritma pembelajaran agnostik untuk keluarga ini (lihat Klivans--O'Donnell--Servedio). Referensi: Tautan obrolan dengan Grok 4.20 (Beta). Bola Keith. Masalah Isoperimetrik Terbalik untuk Ukuran Gaussian. Geometri Diskrit dan Komputasi, 10:411–420, 1993. Adam Klivans, Ryan O'Donnell, dan Rocco A Servedio. Mempelajari konsep geometris melalui luas permukaan Gaussian. Dalam Proc. Simposium IEEE ke-49 tentang Yayasan Ilmu Komputer (FOCS), halaman 541–550, 2008. Shivam Nadimpalli, Caleb Pascale. Pada perimeter Gaussian maksimum dari set cembung, ditinjau kembali. Pracetak (2025) Fedor Nazarov. Pada perimeter maksimum cembung yang ditetapkan dalam R^n sehubungan dengan ukuran Gaussian. Dalam Aspek Geometris Analisis Fungsional (2001-2002) halaman 169–187. Catatan Kuliah dalam Matematika, Volume 1807, Springer, 2003 Martin Raicz. Teorema Berry-Esseen multivariat dengan konstanta eksplisit. Bernoulli 25(4A), 2019, 2824–2853
Untuk lebih jelasnya, jika saya memberi tahu DS untuk TIDAK menyerah, ia berpikir jauh lebih keras, 12 menit di sini, dan menawarkan gambaran tentang bagaimana konstanta dapat ditingkatkan. Tetapi kode yang dihasilkannya gagal. Setelah direnungkan, ia menyerah. Sebenarnya, secara kualitatif tampaknya "benar", tetapi mendapat 0,3116, <Grok
Jika kode DeepSeek diperbaiki (bahkan oleh DeepSeek), itu menghasilkan hasil yang menyatu ke nilai Grok. Jadi saya kira dengan REPL yang cukup sepele itu akan "berhasil" dengan cara yang sama. Bagaimanapun, utilitas yang lebih tinggi untuk Grok di sini.
123