Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

swyx
Mencapai ambisi dengan intensitas, intensitas, & integritas
- @smol_ai
- @dxtipshq
- @sveltesociety
- @aidotengineer
- @coding_career
- @latentspacepod
selamat kepada Bee karena dijemput oleh Amazon; mirip dengan Blink, Ring, Eero dan ofc Claude + Nova + Alexa baru, saya pikir @panos_panay sedang menyusun tindakan kedua yang cukup solid dari strategi perangkat keras ai Amazon
tahu Bee menang ketika @dharmesh muncul di @latentspacepod goyangnya

12,27K
alasan analisis llm (dan regulasi, dan PMing) sulit*
adalah bahwa DIMENSI yang relevan terus bergerak dengan setiap generasi model perbatasan; Tidak cukup hanya menempatkan sumbu X atau Y Anda dalam skala log dan melacak hukum penskalaan, Anda harus benar-benar melakukan pekerjaan untuk memikirkan bagaimana model berbeda secara struktural pada tahun 2025 vs 2024 vs 2023 dan seterusnya
misalnya
Semua orang fokus pada Elo selama 2 tahun, Elo dipermainkan dan kehilangan kredibilitas
Semua orang fokus pada harga per token selama 3 tahun, model penalaran memiliki variasi 10-40x dalam token keluaran per tugas, harga per token kehilangan makna
Kumpulkan data sesuka Anda, tetapi jika Anda hanya mengumpulkan deret waktu yang murni, Anda dapat melupakan gambaran yang lebih besar
*(dan mengapa pernyataan seperti "insinyur ai bukan sesuatu karena semua insinyur perangkat lunak adalah insinyur AI" mengatasi dan tidak akan pernah benar kecuali dalam arti yang paling sepele)

Scott Huston22 Jul, 08.30
Apakah ada spreadsheet publik dari semua model LLM terkemuka dari berbagai perusahaan yang menunjukkan harga, skor tolok ukur, skor elo arena, dll?
9,71K
swyx memposting ulang
🆕 Merilis seluruh trek RL + Reasoning kami!
Menampilkan:
• @willccbb, Kecerdasan Utama
• @GregKamradt, Hadiah Arc
• @natolambert, AI2 / Interkoneksi
• @corbtt, Pipa Terbuka
• @achowdhery, Refleksi
• @ryanmart3n, Dipesan Lebih Dahulu
• @ChrSzegedy, Morph
dengan lokakarya khusus 3 jam dari:
@danielhanchen dari Unsloth!
Mulai di sini:
Selamat menonton akhir pekan! Dan terima kasih kepada @OpenPipeAI karena telah mendukung dan menyelenggarakan lagu ini!

106,66K
swyx memposting ulang
Jika, seperti yang @sgrove usulkan, spesifikasi adalah kode masa depan, lalu apa itu debugging?
1) Kompilasi spesifikasi adalah proses agen pengkodean mengubah spesifikasi menjadi kode
2) semakin banyak "kompilasi" yang tidak diawasi, lebih sedikit menonton agen bekerja diff demi diff, lebih banyak spesifikasi masuk, kode keluar
3) Kesalahan ketik -> kesalahan kebenaran : sebagian besar debugging akan menggali melalui rencana penelitian dan implementasi di Markdown untuk menemukan satu baris konteks yang salah yang membuat agen pengkodean gagal berhasil saat mengimplementasikan. Rangkaian pengujian akan, antara lain, memeriksa kebenaran dan konsistensi logis.
4) Ada rasa urutan baru yang lebih tinggi dari "melampirkan debugger langkah" yang menyaksikan agen menerapkan rencana langkah demi langkah untuk menentukan kesalahan logika dalam spesifikasi. Ketika Anda menemukan kesalahan saat melangkah melalui program baris demi baris, Anda mengubah kode, memulai ulang prosesnya, dan mengulangi hingga berfungsi. Ketika Anda menemukan kesalahan dalam *spesifikasi* saat melangkah melalui implementasi, Anda pergi ke hulu, memperbaiki spesifikasi, dan memulai ulang *implementasi*
10,22K
Kami merilis satu lagu sehari dari @aidotengineer conf sekarang*. Trek RecSys kemarin menjadi hit besar - tetapi sejauh ini trek terpanas adalah liputan kami tentang negara bagian MCP, yang diselenggarakan oleh @Calclavia
slide favorit pribadi adalah di sinilah saya menyadari @AnthropicAI dogfoods MCP -cara- lebih sulit dari yang saya pikirkan dari podcast kami dengan @dsp_ dan @jspahrsummers
Lihatlah pembicaraan ini dan berikan teriakan kepada pembicara favorit Anda!
*sebagian besar sudah tersedia sebagai "tidak terdaftar" melalui "Daftar Putar Lengkap" jika Anda menelusuri

21,68K
"Tiga hal: model penelitian mendalam dengan browser pencarian yang ditingkatkan; operator penggunaan komputer yang revolusioner; dan terminal kotak pasir untuk mengeksekusi matematika dan kode. Browser, komputer, terminal... Apakah Anda mengerti?
Ini bukan tiga perangkat terpisah.
Ini adalah satu perangkat, dan kami menyebutnya Agen."

395
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal