Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Усі припускають, що пам'ять ChatGPT — це якась складна система RAG з векторними базами даних і семантичним пошуком.
Мантан провів це у зворотному спроектуванні. Сама архітектура майже розчаровуюче проста: метадані сесії, що закінчуються, явні факти, збережені у тексті, легкі підсумки чату та ковзне вікно.
Без вбудовувань. Пошуку схожості немає. Забор у масштабах немає.
Цікаво? Це пояснює, чому все здається таким швидким. Традиційні системи RAG вбудовують кожне повідомлення, виконують пошук схожості для кожного запиту, отримують повний контекст. ChatGPT просто безпосередньо впроваджує попередньо обчислені резюме. Вони обмінюють детальний історичний контекст на затримку.
Це той самий урок, який постійно повторюється в інфраструктурі ШІ: коли ти керуєш усім стеком, кураторська простота часто перевершує складність. OpenAI не потрібно будувати загальну систему пошуку. Їм просто потрібен варіант, який працює для ChatGPT.
Чотиришарова архітектура (метадані сесії → збережені факти → резюме розмов → ковзне вікно) фактично є ручною ієрархією пам'яті. Кожен шар має різну стійкість і різне призначення. Метадані сесії адаптуються в режимі реального часу. Факти залишаються вічними. Підсумки забезпечують безперервність. Вікно зберігає цілісність.
Система пам'яті Anthropic використовує схожий візерунок. Моделі, які здаються найособистішими, не мають найскладніший метод вилучення. Саме вони зберігають потрібні речі і вводять їх у потрібний час.
Найкращі
Рейтинг
Вибране
