DApp Store | Pusat Web3 untuk Event & Game

Explore the Momentum ecosystem and earn $1.015M in rewards

Topik trending

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP+16,27%

Boopa+7,52%

PORK-11,24%

Tim Dettmers

Tim Dettmers12 Agu, 20.08

Dalam pandangan saya, SWE-bench dan T-bench adalah beberapa tolok ukur yang memiliki sinyal baik dalam hal seberapa banyak kemajuan yang kita buat dengan model. Model ini berkinerja sebaik Qwen3 Coder dan hanya 10% lebih buruk dari GPT-5, sementara juga menjadi LLM tujuan umum daripada khusus kode.

Z.ai11 Agu, 11.43

Mempresentasikan laporan teknis GLM-4.5! 👇 Pekerjaan ini menunjukkan bagaimana kami mengembangkan model yang unggul dalam penalaran, pengkodean, dan tugas agen melalui paradigma pelatihan multi-tahap yang unik. Inovasi utama termasuk iterasi model ahli dengan distilasi mandiri untuk menyatukan kemampuan, mode penalaran hibrida untuk pemecahan masalah dinamis, dan kurikulum pembelajaran penguatan berbasis kesulitan.

28,5K

Tim Dettmers memposting ulang

Andrej Karpathy4 Agu, 02.36

Hujan pikiran: Alih-alih menyimpan pembayaran Twitter/X Anda, arahkan ke "PayoutChallenge" pilihan Anda - apa pun yang Anda inginkan lebih banyak di dunia! Inilah milik saya untuk putaran ini, menggabungkan 3 pembayaran terakhir saya sebesar $5478.51: Sangat penting bahwa umat manusia tidak jatuh saat AI naik. Kemanusiaan harus terus bangkit, menjadi lebih baik di samping. Buat sesuatu yang dirancang khusus untuk mengangkat manusia tim. Definisi sengaja dibiarkan agak kabur untuk menjaga beberapa entropi di sekitar interpretasi orang, tetapi contoh imo meliputi: - Setiap perangkat lunak yang membantu penjelasan, visualisasi, hafalan, inspirasi, pemahaman, koordinasi, dll... - Tidak harus terlalu tinggi, misalnya bisa berupa artikel/video pendidikan tertentu yang menjelaskan sesuatu yang dapat dimanfaatkan oleh beberapa orang lain atau yang Anda miliki pengetahuan unik. - Pemintaan/agen untuk penjelasan, misalnya sejalan dengan mode studi ChatGPT yang baru dirilis. - Karya seni terkait Tantangan ini akan berlangsung selama 2 minggu hingga 17 Agustus EOD PST. Kirimkan kontribusi Anda sebagai balasan. Itu harus menjadi sesuatu yang diciptakan secara unik untuk tantangan ini dan tidak akan ada sebaliknya. Kriteria termasuk eksekusi, leverage, kebaruan, inspirasi, estetika, hiburan. Orang dapat memberikan suara positif kepada kiriman dengan menyukai, "pilihan orang" ini juga akan menjadi faktor. Saya akan memutuskan pemenang pada 17 Agustus dan mengirim $5478.51 :)

676,38K

Tim Dettmers memposting ulang

Akari Asai16 Jul 2025

Beberapa pembaruan 🚨 Saya menyelesaikan gelar Ph.D saya di @uwcse pada Juni 2025! Setelah setahun di AI2 sebagai Ilmuwan Riset, saya bergabung dengan CMU @LTIatCMU & @mldcmu (istimewa) sebagai Asisten Profesor pada Musim Gugur 2026. Perjalanan, pengakuan & perekrutan di 🧵

98,79K

Tim Dettmers memposting ulang

Dan Alistarh14 Jul 2025

Mengumumkan pekerjaan awal kami tentang inferensi FP4 untuk LLM! - QuTLASS: dukungan kernel presisi rendah untuk GPU Blackwell - FP-Quant: harness kuantisasi fleksibel untuk Llama/Qwen Kami mencapai percepatan 4x vs BF16, dengan akurasi yang baik melalui skala mikro MXFP4 + rotasi Hadamard yang menyatu.

22,55K

Tim Dettmers memposting ulang

Albert Gu12 Jul 2025

Tokenisasi hanyalah kasus khusus dari "chunking" - membangun data tingkat rendah menjadi abstraksi tingkat tinggi - yang pada gilirannya mendasar bagi kecerdasan. Arsitektur baru kami, yang memungkinkan *pemotongan dinamis* hierarkis, tidak hanya bebas tokenizer, tetapi hanya menskalakan lebih baik.

194,73K

Tim Dettmers memposting ulang

Matej Sirovatka8 Jul 2025

Himpunan data terbesar dari Kode GPU yang ditulis manusia semuanya open-source? 👀 YA Tolong! Kami di @GPU_MODE telah merilis sekitar 40 ribu 🚀 sampel kode yang ditulis manusia yang mencakup Triton, Hip dan PyTorch dan semuanya terbuka di @huggingface Hub. Latih GPT baru untuk membuat GPT lebih cepat ⚡️ Tautan di bawah ini ⬇️

28,87K

Tim Dettmers memposting ulang

Albert Gu8 Jul 2025

Saya sangat menyukai hasil ini: pembingkaian dan solusi yang elegan untuk secara signifikan meningkatkan generalisasi panjang dalam model berulang pada umumnya (RNN/SSM/perhatian linier/dll). Hal ini memiliki implikasi yang signifikan bagi masalah yang harus difokuskan oleh peneliti arsitektur, IMO

13,06K

Tim Dettmers memposting ulang

Julian Michael8 Jul 2025

Saya mungkin harus mengumumkan bahwa beberapa bulan yang lalu, saya bergabung dengan @scale_AI untuk memimpin Lab Keselamatan, Evaluasi, dan Penyelarasan... dan hari ini, saya bergabung dengan @Meta untuk terus mengerjakan penyelarasan AI dengan @summeryue0 dan @alexandr_wang. Sangat bersemangat untuk apa yang bisa kita capai bersama!

40,81K

Tim Dettmers memposting ulang

Graham Neubig1 Jul 2025

Seperti apa pengembangan perangkat lunak pada tahun 2026? Dengan agen pengkodean yang meningkat pesat, peran pengembang mungkin terlihat sangat berbeda. Alur kerja saya saat ini telah banyak berubah: - Bekerja di github, bukan IDE - Agen secara paralel - Tulis bahasa Inggris, bukan kode - Lebih banyak ulasan kode Pikiran + video👇

15,62K

Tim Dettmers memposting ulang

Aditya Kusupati27 Jun 2025

📢Sekarang terbuka, Gemma 3n membebani & itu secara asli fleksibel, pertama dari jenisnya, berkat MatFormer🪆 Model apa pun antara E4B & E2B dengan pelatihan ZERO di dekat Pareto - kami menemukan banyak! Temukan E3B yang lebih baik dari yang kami rilis, saya akan mengirimkan Anda 🪆😉 Temukan colab untuk ekstraksi 🧵👇🪆

30,71K

Teratas

Peringkat

Favorit

Trending onchain

Trending di X

Pendanaan teratas terbaru

Paling terkenal