Microsoft vient de lancer VibeVoice-ASR sur Hugging Face
Un modèle de transcription audio en texte unifié qui transcrit des heures d'audio en un seul passage
Avec une diarisation des locuteurs intégrée, des horodatages et un contexte utilisateur personnalisable
Pensée Multiplex
Une approche de branchement et de fusion de Microsoft Research et de UPenn. Échantillonne K tokens par étape en un seul token multiplex—auto-adaptatif : les étapes confiantes agissent comme CoT, celles incertaines représentent plusieurs chemins. Surpasse le CoT discret avec des séquences plus courtes.
RubricHub
Un ensemble de données de rubriques à grande échelle avec ~110k instances pour entraîner des modèles de génération ouverts. Utilise un cadre automatisé de grossier à fin pour créer des critères d'évaluation hautement discriminants, permettant à Qwen3-14B de surpasser GPT-5 sur HealthBench.