Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Tim Dettmers
Dalam pandangan saya, SWE-bench dan T-bench adalah beberapa tolok ukur yang memiliki sinyal baik dalam hal seberapa banyak kemajuan yang kita buat dengan model. Model ini berkinerja sebaik Qwen3 Coder dan hanya 10% lebih buruk dari GPT-5, sementara juga menjadi LLM tujuan umum daripada khusus kode.

Z.ai11 Agu, 11.43
Mempresentasikan laporan teknis GLM-4.5! 👇
Pekerjaan ini menunjukkan bagaimana kami mengembangkan model yang unggul dalam penalaran, pengkodean, dan tugas agen melalui paradigma pelatihan multi-tahap yang unik.
Inovasi utama termasuk iterasi model ahli dengan distilasi mandiri untuk menyatukan kemampuan, mode penalaran hibrida untuk pemecahan masalah dinamis, dan kurikulum pembelajaran penguatan berbasis kesulitan.

28,5K
Tim Dettmers memposting ulang
Hujan pikiran: Alih-alih menyimpan pembayaran Twitter/X Anda, arahkan ke "PayoutChallenge" pilihan Anda - apa pun yang Anda inginkan lebih banyak di dunia!
Inilah milik saya untuk putaran ini, menggabungkan 3 pembayaran terakhir saya sebesar $5478.51:
Sangat penting bahwa umat manusia tidak jatuh saat AI naik. Kemanusiaan harus terus bangkit, menjadi lebih baik di samping. Buat sesuatu yang dirancang khusus untuk mengangkat manusia tim. Definisi sengaja dibiarkan agak kabur untuk menjaga beberapa entropi di sekitar interpretasi orang, tetapi contoh imo meliputi:
- Setiap perangkat lunak yang membantu penjelasan, visualisasi, hafalan, inspirasi, pemahaman, koordinasi, dll...
- Tidak harus terlalu tinggi, misalnya bisa berupa artikel/video pendidikan tertentu yang menjelaskan sesuatu yang dapat dimanfaatkan oleh beberapa orang lain atau yang Anda miliki pengetahuan unik.
- Pemintaan/agen untuk penjelasan, misalnya sejalan dengan mode studi ChatGPT yang baru dirilis.
- Karya seni terkait
Tantangan ini akan berlangsung selama 2 minggu hingga 17 Agustus EOD PST. Kirimkan kontribusi Anda sebagai balasan. Itu harus menjadi sesuatu yang diciptakan secara unik untuk tantangan ini dan tidak akan ada sebaliknya. Kriteria termasuk eksekusi, leverage, kebaruan, inspirasi, estetika, hiburan. Orang dapat memberikan suara positif kepada kiriman dengan menyukai, "pilihan orang" ini juga akan menjadi faktor. Saya akan memutuskan pemenang pada 17 Agustus dan mengirim $5478.51 :)
676,38K
Tim Dettmers memposting ulang
Beberapa pembaruan 🚨
Saya menyelesaikan gelar Ph.D saya di @uwcse pada Juni 2025!
Setelah setahun di AI2 sebagai Ilmuwan Riset, saya bergabung dengan CMU @LTIatCMU & @mldcmu (istimewa) sebagai Asisten Profesor pada Musim Gugur 2026.
Perjalanan, pengakuan & perekrutan di 🧵


98,79K
Tim Dettmers memposting ulang
Mengumumkan pekerjaan awal kami tentang inferensi FP4 untuk LLM!
- QuTLASS: dukungan kernel presisi rendah untuk GPU Blackwell
- FP-Quant: harness kuantisasi fleksibel untuk Llama/Qwen
Kami mencapai percepatan 4x vs BF16, dengan akurasi yang baik melalui skala mikro MXFP4 + rotasi Hadamard yang menyatu.


22,55K
Tim Dettmers memposting ulang
Tokenisasi hanyalah kasus khusus dari "chunking" - membangun data tingkat rendah menjadi abstraksi tingkat tinggi - yang pada gilirannya mendasar bagi kecerdasan.
Arsitektur baru kami, yang memungkinkan *pemotongan dinamis* hierarkis, tidak hanya bebas tokenizer, tetapi hanya menskalakan lebih baik.

194,73K
Tim Dettmers memposting ulang
Himpunan data terbesar dari Kode GPU yang ditulis manusia semuanya open-source? 👀 YA Tolong! Kami di @GPU_MODE telah merilis sekitar 40 ribu 🚀 sampel kode yang ditulis manusia yang mencakup Triton, Hip dan PyTorch dan semuanya terbuka di @huggingface Hub. Latih GPT baru untuk membuat GPT lebih cepat ⚡️
Tautan di bawah ini ⬇️
28,87K
Tim Dettmers memposting ulang
Saya sangat menyukai hasil ini: pembingkaian dan solusi yang elegan untuk secara signifikan meningkatkan generalisasi panjang dalam model berulang pada umumnya (RNN/SSM/perhatian linier/dll).
Hal ini memiliki implikasi yang signifikan bagi masalah yang harus difokuskan oleh peneliti arsitektur, IMO
13,06K
Tim Dettmers memposting ulang
Saya mungkin harus mengumumkan bahwa beberapa bulan yang lalu, saya bergabung dengan @scale_AI untuk memimpin Lab Keselamatan, Evaluasi, dan Penyelarasan... dan hari ini, saya bergabung dengan @Meta untuk terus mengerjakan penyelarasan AI dengan @summeryue0 dan @alexandr_wang. Sangat bersemangat untuk apa yang bisa kita capai bersama!
40,81K
Tim Dettmers memposting ulang
Seperti apa pengembangan perangkat lunak pada tahun 2026?
Dengan agen pengkodean yang meningkat pesat, peran pengembang mungkin terlihat sangat berbeda. Alur kerja saya saat ini telah banyak berubah:
- Bekerja di github, bukan IDE
- Agen secara paralel
- Tulis bahasa Inggris, bukan kode
- Lebih banyak ulasan kode
Pikiran + video👇
15,62K
Tim Dettmers memposting ulang
📢Sekarang terbuka, Gemma 3n membebani & itu secara asli fleksibel, pertama dari jenisnya, berkat MatFormer🪆
Model apa pun antara E4B & E2B dengan pelatihan ZERO di dekat Pareto - kami menemukan banyak!
Temukan E3B yang lebih baik dari yang kami rilis, saya akan mengirimkan Anda 🪆😉
Temukan colab untuk ekstraksi 🧵👇🪆

30,71K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal