8 архитектур моделей ИИ, визуально объясненных: Все говорят о LLM, но есть целое семейство специализированных моделей, которые делают невероятные вещи. Вот краткий обзор: 1. LLM (Большие Языковые Модели) Текст поступает, токенизируется в эмбеддинги, обрабатывается через трансформеры, и текст выходит. ↳ GPT, Claude, Gemini, Llama. 2. LCM (Большие Концептуальные Модели) Работает на уровне концепций, а не токенов. Вход делится на предложения, проходит через эмбеддинги SONAR, а затем использует диффузию перед выводом. ↳ LCM от Meta является пионером. 3. LAM (Большие Модели Действий) Превращает намерение в действие. Вход проходит через восприятие, распознавание намерений, разбиение задач, затем планирование действий с памятью перед выполнением. ↳ Rabbit R1, Microsoft UFO, Claude Computer Use. 4. MoE (Смешение Экспертов) Маршрутизатор решает, какие специализированные "эксперты" обрабатывают ваш запрос. Активируются только релевантные эксперты. Результаты проходят через отбор и обработку. ↳ Mixtral, GPT-4, DeepSeek. ...