DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Mistral baru saja meluncurkan model bobot terbuka besar baru mereka, Mistral Large 3 (total 675B, 41B aktif), bersama satu set tiga model Ministral (3B, 8B, 14B) Mistral telah merilis varian Instruct (non-penalaran) dari keempat model, serta varian penalaran dari ketiga model Ministral. Semua model mendukung input multimoda dan tersedia dengan lisensi Apache 2.0 hari ini di @huggingface. Kami mengevaluasi varian Mistral Large 3 dan Instruct dari tiga model Ministral sebelum diluncurkan. Model skor tertinggi Mistral dalam Indeks Kecerdasan Analisis Buatan tetap menjadi Magistral Medium 1.2 eksklusif, diluncurkan beberapa bulan yang lalu pada bulan September - ini karena penalaran yang memberi model keuntungan yang signifikan dalam banyak model yang kami gunakan. Mistral mengungkapkan bahwa versi penalaran dari Mistral Large 3 sudah dalam pelatihan dan kami berharap dapat segera mengevaluasinya! Sorotan utama: ➤ Model besar dan kecil: dengan total 675B dengan 41B aktif, Mistral Large 3 adalah model campuran ahli bobot terbuka pertama Mistral sejak Mixtral 8x7B dan 8x22B pada akhir 2023 hingga awal 2024. Rilis Ministral padat dengan varian parameter 3B, 8B, dan 14B ➤ Peningkatan kecerdasan yang signifikan tetapi tidak di antara model terkemuka (termasuk kepemilikan): Mistral Large 3 mewakili peningkatan yang signifikan dibandingkan dengan Mistral Large 2 sebelumnya dengan peningkatan +11 poin pada Indeks Kecerdasan hingga 38. Namun, Large 3 masih membuntuti model penalaran & non-penalaran eksklusif terkemuka ➤ Model kecil serbaguna: model Ministral dirilis dengan bobot varian Base, Instruct, dan Reasoning - kami hanya menguji varian Instruct sebelum dirilis, yang mencapai skor Indeks 31 (14B), 28 (8B), dan 22 (3B). Ini menempatkan Ministral 14B di depan Mistral Small 3.2 sebelumnya dengan parameter 40% lebih sedikit. Kami sedang bekerja untuk mengevaluasi varian penalaran dan akan segera membagikan hasil intelijen mereka. ➤ Kemampuan multi-modal: semua model dalam rilis mendukung input teks dan gambar - ini adalah pembeda yang signifikan untuk Mistral Large 3, karena hanya sedikit model bobot terbuka di kelas ukurannya yang mendukung input gambar. Panjang konteks juga meningkat menjadi 256k, memungkinkan tugas input yang lebih besar. Model baru dari Mistral ini bukanlah perubahan langkah dari kompetisi bobot terbuka, tetapi mereka mewakili basis kinerja yang kuat dengan kemampuan penglihatan. Varian Ministral 8B dan 14B menawarkan kinerja yang sangat menarik untuk ukurannya, dan kami senang melihat bagaimana komunitas menggunakan dan membangun model-model ini. Saat diluncurkan, model baru tersedia untuk inferensi nirserver di @MistralAI dan berbagai penyedia lain termasuk @awscloud Bedrock, @Azure AI Foundry, @IBMwatsonx, @FireworksAI_HQ, @togethercompute, dan @modal.

Mistral Large 3 membuntuti perbatasan, tetapi terutama merupakan salah satu model non-penalaran multimodal bobot terbuka yang paling cerdas. Model terbaru dari DeepSeek (v3.2) dan Moonshot (Kimi K2) terus hanya mendukung input dan output teks.

Karena ukurannya yang kecil, rilis Ministral menunjukkan pengorbanan biaya intelijen yang solid, menyelesaikan evaluasi Indeks dengan biaya yang jauh lebih rendah daripada model yang sebanding seperti model kecil dari keluarga Qwen3 - terutama varian VL yang mendukung input gambar seperti Ministral.

Model Ministral secara khusus dibedakan untuk tugas-tugas yang membutuhkan input gambar dan model non-penalaran. Ketiga ukuran tersebut merupakan peningkatan yang signifikan dari keluarga Gemma 3 Google (sebelumnya merupakan opsi masuk untuk model multimoda kecil) dan kompetitif dengan rilis Qwen3 VL Alibaba baru-baru ini.

Magistral Medium 1.2 tetap menjadi model terkemuka Mistral secara keseluruhan dalam Indeks Inteligence Analisis Buatan.

Untuk analisis lebih lanjut tentang model baru ini dan penyedia untuk mereka saat muncul, lihat halaman model kami tentang Analisis Buatan: Mistral Besar 3: Layanan 14B: Layanan 8B:

8,15K

Teratas

Peringkat

Favorit