Událost spuštění Grok4 lze popsat pouze jako průměrnou a konkrétní výkon je po vyzkoušení trochu neuspokojivý Zde je shrnutí 👇 prezentace 1. Výkon: Grok 4 si vede dobře v multidoménových testech, s mnohem vyšší mírou přesnosti než podobné modely v obtížných otázkách, jako je "Ultimate Human Exam", lepší multiagentní verze a plný počet bodů v programování, matematice a dalších testech, a jeho akademické schopnosti dosáhly postgraduální úrovně a předčily většinu lidí. 2. Rozvoj tréninku: Od Grok 2 do 4 se množství tréninku řádově zvyšuje a 4. generace je 100krát vyšší než 2. generace. Generace 3 až 4 se zaměřují na uvažování a zpětnovazební učení s pomocí rozšiřování dat a dalších technologií a superpočítačů k dosažení principiálního uvažování a sebekorekce. 3. Funkční aplikace: Zpoždění hlasové interakce se sníží na polovinu a přidá se přirozený hlas; Po otevření API je široce používáno v obchodní simulaci, vědeckém výzkumu, vývoji her a dalších oblastech, jako je zvyšování čisté hodnoty obchodu s prodejními automaty, urychlení vědeckého výzkumu a rychlý vývoj her. 4. Plány do budoucna: Spustit kódovací modely během několika týdnů s cílem zlepšit multimodální schopnosti; V příštích 3-4 týdnech bude zahájeno školení generování videa s cílem vytvářet rychlejší a chytřejší modely a podporovat modernizaci lidské civilizace.
8,48K