Технічна архітектура DeepSeek-v4 представлена заздалегідь! Усі знають, що сучасна архітектура великої моделі MoE інтегрує здатність і знання ШІ до мислення в кожного експерта, тож чи можливо експертам використовувати її лише для міркування, а потім зберігати велику кількість зовнішніх знань у певній області, формуючи архітектуру, схожу на Кіборга, описаного в Ghost in the Shell, яка насправді складається з електронного мозку + зовнішньої пам'яті? DeepSeek це зробив!