8 архітектур моделей ШІ, візуально пояснені: Всі говорять про LLM, але є ціла родина спеціалізованих моделей, які роблять неймовірні речі. Ось короткий розбір: 1. LLM (Великі мовні моделі) Текст потрапляє, токенізується у вкладення, обробляється через трансформери, і текст виходить. ↳ GPT, Клод, Близнюки, Лама. 2. LCM (Великі концептуальні моделі) Працює на рівні концепту, а не на токенах. Вхід сегментується на речення, проходить через SONAR-вкладення, а потім використовує дифузію перед виводом. ↳ LCM від Meta — піонер. 3. LAM (моделі з великим механізмом) Перетворює намір на дію. Вхідні дані проходять через сприйняття, розпізнавання наміру, розподіл завдань, а потім планування дій з пам'яттю перед виконанням. ↳ Rabbit R1, Microsoft UFO, Claude Computer Use. 4. MoE (Суміш експертів) Роутер вирішує, які спеціалізовані «експерти» оброблятимуть ваш запит. Активуються лише відповідні експерти. Результати проходять відбір і обробку. ↳ Mixtral, GPT-4, DeepSeek. ...