🙌LLM any-to-any world vítá Ming-flash-omni-preview, který se vyznačuje výkonným obloukem 103B-A9B, který je vysoce efektivní díky řídkému MoE. Stanovuje nový benchmark pro open-source omni-modální výkon v porozumění a generování: 1. Kontrolovatelné generování obrázků: Představujeme generativní segmentaci při úpravách, která umožňuje přesné ovládání na úrovni pixelů. Model dosáhl skóre *0,90* v benchmarku GenEval. 2. Porozumění streamovanému videu: Vylepšené možnosti pro detailní a bezproblémové audiovizuální porozumění. 3. Rozpoznávání dialektů: Dosažení výkonu SOTA v čínském dialektu ASR, prokázání znalosti v různých dialektech, jako je hunština, kantonština a minnanština. #OpenSourceModels