DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Artificial Analysis

Analisis independen model AI dan penyedia hosting - pilih model dan penyedia API terbaik untuk kasus penggunaan Anda

DeepSeek meluncurkan V3.1, menyatukan V3 dan R1 menjadi model penalaran hibrida dengan peningkatan kecerdasan bertahap Peningkatan kecerdasan tambahan: Hasil pembandingan awal untuk DeepSeek V3.1 menunjukkan Indeks Kecerdasan Analisis Buatan 60 dalam mode penalaran, naik dari skor R1 59. Dalam mode non-penalaran, V3.1 mencapai skor 49, peningkatan yang lebih besar dari skor V3 0324 sebelumnya sebesar 44. Ini meninggalkan V3.1 (penalaran) di belakang Qwen3 235B 2507 terbaru Alibaba (penalaran) - DeepSeek belum memimpin kembali. Penalaran hibrida: @deepseek_ai telah beralih ke model penalaran hibrida untuk pertama kalinya - mendukung mode penalaran dan non-penalaran. Perpindahan DeepSeek ke model penalaran hibrida terpadu meniru pendekatan yang diambil oleh OpenAI, Anthropic, dan Google. Namun, menarik untuk dicatat bahwa Alibaba baru-baru ini meninggalkan pendekatan hibrida yang mereka sukai untuk Qwen3 dengan rilis terpisah dari model penalaran dan instruksi Qwen3 2507. Pemanggilan fungsi / penggunaan alat: Sementara DeepSeek mengklaim pemanggilan fungsi yang ditingkatkan untuk model, DeepSeek V3.1 tidak mendukung pemanggilan fungsi saat dalam mode penalaran. Hal ini kemungkinan akan secara substansial membatasi kemampuannya untuk mendukung alur kerja agen dengan persyaratan intelijen, termasuk dalam agen pengkodean. Penggunaan token: DeepSeek V3.1 mendapat skor yang lebih tinggi secara bertahap dalam mode penalaran daripada DeepSeek R1, dan menggunakan sedikit lebih sedikit token di seluruh eval yang kami gunakan untuk Indeks Kecerdasan Analisis Buatan. Dalam mode non-penalaran, ia menggunakan sedikit lebih banyak token daripada V3 0324 - tetapi masih beberapa kali lebih sedikit daripada dalam mode penalarannya sendiri. API: API pihak pertama DeepSeek sekarang melayani model DeepSeek V3.1 baru pada titik akhir obrolan dan penalaran mereka - cukup mengubah apakah token pemikiran akhir </think> disediakan ke model dalam templat obrolan untuk mengontrol apakah model akan beralasan. Arsitektur: DeepSeek V3.1 secara arsitektur identik dengan model V3 dan R1 sebelumnya, dengan parameter total 671B dan parameter aktif 37B. Implikasi: Kami akan menyarankan untuk berhati-hati dalam membuat asumsi apa pun tentang apa yang tersirat dari rilis ini tentang kemajuan DeepSeek menuju model masa depan yang disebut dalam rumor sebagai V4 atau R2. Kami mencatat bahwa DeepSeek sebelumnya merilis model terakhir yang dibangun di atas arsitektur V2 mereka pada 10 Desember 2024, hanya dua minggu sebelum merilis V3.

Teratas

Peringkat

Favorit