Що таке AskSim? - AI-first з умовним пошуком - Оркестровка моделей з відкритим вихідним кодом (система використовує ряд моделей - Llama, Qwen, DeepSeek та інші) - Паралельна прогресивна обробка Асистент зі штучним інтелектом, який починає відповідати за 200 мс, поступово вдосконалюється та отримує дані в реальному часі лише за потреби.
dndNGMI
dndNGMI15 лип., 06:33
Як працює система AskSim - науковий співробітник AI Research Огляд архітектури Запит користувача → оркестратор прогресивних відповідей ├── Фаза 1: миттєва реакція (200-300 мс) │ └── Швидкі моделі (Llama-3.1-8B-fast) ├── Фаза 2: Посилене реагування (паралельне) │ └── Потужні моделі (Llama-3.3-70B), DeepSeek └── Етап 3: Покращення пошуку (умовно) └── Синтез → Serper/Exa API з цитуваннями У цьому конкретному прикладі: 🔧 Пояснення прогресивного вдосконалення: Фаза 1: Llama-3.1-8B-Інструктаж-швидкий - 8 мільярдів параметрів - Оптимізовано для швидкості - Час відгуку 200 мс - Покриває 80% якості відповідей Фаза 2: Лама-3.3-70Б-Інструктаж - 70 мільярдів параметрів - Більша модель у 8,75 разів - Додає нюанси, приклади, глибину - Заповнює решту 20% Результат: 100% якість, в 10 разів кращий UX. Це як мати швидкого помічника, який відповідає відразу, а професор готує детальну лекцію на задньому плані. Особливості 1. Блискавичні прогресивні реакції - 200 мс до першого токена - користувачі бачать відповіді миттєво, а не через 3+ секунди - Паралельне виконання фаз - посилене і пошукове виконання одночасно - Прогресивне вдосконалення (миттєве → розширене → пошуку) 2. Інтеграція інтелектуального пошуку - Автоматичне визначення термінових запитів - Провайдери подвійного пошуку (Serper + Exa) 3. Оптимізована за вартістю багатомодельна система - Підбір моделі за рівнем @nebiusaistudio - Рівні якості: миттєвий → покращений → преміум - Платежі з використанням х402 за @CoinbaseDev @yugacohler та @Sagaxyz__ @solana $CLSTR $DND
3,36K