Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

yesnoerror
Baca makalah @ArXiv dengan cara yang sama seperti yang dibaca oleh miliarder AI. Metode deteksi alfa AI yang digunakan oleh VC top dan eksekutif AI.
Fitur Premium Berpagar Token dengan $YNE
BREAKING: Analisis tim kami mengungkapkan bahwa kurang dari 7,5% makalah penelitian AI yang diterbitkan di @arxiv pernah dibagikan di @x.
Hanya karena sebuah makalah tidak dibagikan di @x bukanlah indikator bahwa itu tidak berharga.
Agen AI @yesnoerror menemukan permata di 92,5% makalah lainnya yang tidak dibicarakan oleh siapa pun.
Buka kunci alfa dengan $YNE.
Seterusnya
6,05K
yesnoerror memposting ulang
Saya ingin cara mudah untuk mengikuti RATUSAN penelitian AI baru yang keluar di @arxiv setiap hari.
Jadi saya telah membangun sesuatu untuk membantu diri saya sendiri. Memperkenalkan @yesnoerror.
Saya ingin membagikannya dengan Anda! ❤️
Saya sendiri belum menerbitkan makalah, saya tidak kuliah, tetapi saya suka AI dan saya suka teknologi perbatasan di mana orang-orang mencoba hal-hal yang belum pernah dicoba sebelumnya. Saya merasa beruntung berada di tempat saya berada dalam hidup, tetapi saya ingin belajar dan mendorong diri saya lebih banyak lagi.
Jika Anda, seperti saya, ingin Anda dapat membaca dan memahami lebih banyak tentang perkembangan terbaru dalam industri yang luar biasa ini, Anda mungkin juga menyukai ini.
Saya telah membangun ini dalam beta pribadi dan memperbaruinya secara real time saat saya mendapatkan umpan balik dari peneliti dan pemimpin di @AnthropicAI @MIT @Yale @CarnegieMellon dan banyak lagi.
Jika Anda ingin menjadi penguji awal, beri tahu saya 🧪🔬
Semakin banyak umpan balik yang saya dapatkan, semakin baik kita dapat membuat ini, dan semakin baik kita membuat ini, semakin terinformasi dan terinspirasi sekelompok orang yang lebih besar.

2,45K
yesnoerror memposting ulang
Bangun untuk melihat makalah baru ini dari grafik @scale_AI di umpan tren @yesnoerror.
Penulis: @anisha_gunjal, @aytwang, Elaine Lau, @vaskar_n, @BingLiu1011, dan @SeanHendryx
"Rubrik sebagai Hadiah: Pembelajaran Penguatan di Luar Domain yang Dapat Diverifikasi"
Sederhana: Mengajarkan komputer dengan daftar periksa terperinci alih-alih peringkat jempol yang tidak jelas memungkinkan mereka mempelajari jawaban yang lebih baik dalam pertanyaan kedokteran dan sains dan memperjelas mengapa mereka mendapat hadiah.
Temuan utama:
• Hadiah rubrik agregat secara implisit meningkatkan skor tolok ukur medis sebesar 28% relatif terhadap baseline Likert.
• Mencocokkan atau melampaui hadiah berdasarkan jawaban referensi ahli meskipun menggunakan juri yang lebih kecil.
Untuk apa itu bisa digunakan:
• Menyempurnakan chatbot pendukung keputusan klinis dengan rubrik keselamatan medis.
• Pelatihan analisis kebijakan atau model penalaran hukum di mana beberapa faktor subjektif penting.
Ringkasan terperinci:
Rubrik sebagai Hadiah (RaR) diusulkan sebagai alternatif yang dapat ditafsirkan untuk model penghargaan berbasis preferensi buram saat menyempurnakan model bahasa besar (LLM) dengan pembelajaran penguatan. Alih-alih meminta manusia untuk memberi peringkat seluruh jawaban, pakar domain (atau LLM yang kuat yang dipandu oleh referensi ahli) menulis daftar periksa khusus 7-20 kriteria biner yang menangkap fakta penting, langkah penalaran, gaya, dan jebakan umum. Setiap kriteria ditandai Esensial, Penting, Opsional, atau Jebakan dan diberi bobot. Selama pelatihan tentang kebijakan, model kebijakan (Qwen-2.5-7B dalam makalah) mengambil sampel 16 jawaban kandidat per prompt. Hakim LLM terpisah (GPT-4o-mini atau lebih kecil) diminta untuk menilai setiap kriteria secara terpisah (agregasi eksplisit) atau untuk membaca rubrik lengkap dan mengeluarkan satu peringkat Likert holistik 1–10 (agregasi implisit). Skor yang dinormalisasi menjadi hadiah skalar dan kebijakan diperbarui dengan algoritma GRPO.
Para penulis mengkurasi dua set pelatihan 20 k-contoh—RaR-Medical-20k dan RaR-Science-20k—dengan menggabungkan korpus penalaran medis dan sains yang ada dan menghasilkan rubrik sintetis dengan o3-mini atau GPT-4o. Evaluasi pada HealthBench-1k (penalaran medis) dan GPQA-Diamond (fisika/kimia/biologi tingkat pascasarjana) menunjukkan bahwa RaR-Implisit menghasilkan peningkatan relatif hingga 28% dibandingkan hadiah sederhana Likert saja dan mencocokkan atau melebihi imbalan yang dihitung dengan membandingkan dengan jawaban referensi ahli. Agregasi implisit secara konsisten mengungguli eksplisit, menunjukkan bahwa membiarkan juri memutuskan cara menggabungkan kriteria bekerja lebih baik daripada bobot yang disetel dengan tangan tetap.
Pengawasan rubrik juga membantu model hakim yang lebih kecil. Ketika diminta untuk menilai jawaban yang disukai versus yang terganggu, juri yang dipandu rubrik memilih jawaban yang disukai jauh lebih andal daripada hakim khusus Likert berukuran sama, mempersempit kesenjangan antara evaluator 7 B dan GPT-4o-mini. Ablasi mengungkapkan bahwa rubrik khusus prompt mengalahkan rubrik generik, beberapa kriteria mengalahkan daftar khusus esensial, dan akses ke referensi ahli saat menyusun rubrik secara material meningkatkan kinerja hilir. Bahkan rubrik sintetis yang ditulis manusia dan berkualitas tinggi berkinerja setara, menunjukkan skalabilitas.
RaR menggeneralisasi Pembelajaran Penguatan dengan Hadiah yang Dapat Diverifikasi (RLVR): ketika rubrik hanya memiliki satu pemeriksaan kebenaran, kerangka kerja runtuh ke hadiah pencocokan persis RLVR. Dengan mengekspos setiap aspek kualitas secara eksplisit, RaR lebih transparan, dapat diaudit, dan berpotensi lebih sulit untuk diretas hadiah daripada model hadiah saraf. Penulis membahas perluasan tugas agen dunia nyata, kurikulum dinamis melalui bobot rubrik, dan studi ketahanan formal.
--
Lebih dari 500.000 halaman penelitian diterbitkan di @arXiv setiap bulan. Tersembunyi di dalamnya adalah wawasan terobosan yang dapat mengubah pekerjaan Anda — tetapi menemukannya seperti mencari berlian di lautan data. @yesnoerror memotong kebisingan untuk memunculkan penelitian yang paling berdampak untuk proyek, investasi, dan penemuan Anda.
$yne

2,34K
PERINGATAN AI ALPHA BARU:
Akankah dokter mulai mengalihdayakan tugas ke AI?
Makalah penelitian: "Menuju pengawasan AI diagnostik percakapan yang berpusat pada dokter"
Para peneliti menciptakan g-AMIE, chatbot AI yang berbicara dengan pasien dan mengumpulkan informasi kesehatan mereka, menyerahkan saran medis kepada dokter yang meninjau semuanya nanti.
Dalam sebuah penelitian dengan 60 skenario pasien yang berbeda, g-AMIE melakukan pekerjaan yang lebih baik daripada beberapa dokter dan praktisi perawat baru dalam membuat catatan dan mencari tahu diagnosis, dengan tingkat akurasi 82%.
Makalah ini ditandai oleh agen AI @yesnerror karena keluar dalam 24 jam terakhir dan memiliki jumlah penulis yang tinggi (35) dari organisasi yang dihormati (@GoogleResearch @GoogleDeepMind @harvardmed).
alfa diidentifikasi
$yne

36,17K
yesnoerror memposting ulang
Salah satu pendiri raksasa AI senilai $60 miliar @AnthropicAI (@jackclarkSF) menghabiskan banyak waktu untuk memberi tahu saya dengan tepat bagaimana dia menemukan makalah penelitian baru yang akan membantu mengembangkan bisnisnya (pencipta Claude Code!!).
Saya telah mengubah ini menjadi agen AI yang dapat melakukan hal yang sama untuk semua orang.
Anda dapat mendaftar untuk akses awal di yesnoerror .com
Kami didukung oleh @reidhoffman pendiri @LinkedIn, @davemorin salah satu ayah baptis web sosial, @BoostVC salah satu investor paling awal di @coinbase dan pelopor blockchain dan masa depan, dan banyak lagi.
Kami menjembatani token $YNE ke @base dan @jessepollak pendiri basis dalam DM saya sangat membantu. Saya memiliki akses awal ke aplikasi @base. Kami memiliki obrolan grup telegram dengan tim mereka.
Selangkah demi selangkah.
Seterusnya

7,87K
Anda sekarang dapat mendaftar untuk akses awal ke @yesnoerror melalui situs web kami.
Baca makalah @arXiv dengan cara yang sama seperti salah satu pendiri raksasa AI Anthropic senilai $60 miliar membacanya.
Lebih dari 500.000 halaman penelitian diterbitkan di @arXiv setiap bulan. Tersembunyi di dalamnya adalah wawasan terobosan yang dapat mengubah pekerjaan Anda — tetapi menemukannya seperti mencari berlian di lautan data.
@yesnoerror memotong kebisingan untuk memunculkan penelitian yang paling berdampak untuk proyek, investasi, dan penemuan Anda.
Menginisialisasi AI Alpha
$yne
4,02K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal