Sangat didasarkan pada DeepSeek memenangkan makalah terbaik di ACL dengan NSA, kemudian, tampaknya, tidak puas dengan hasil dalam skala besar, menemukan arsitektur yang lebih baik yang dapat menggunakan model perhatian penuh untuk boot, menerbitkannya dan berbagi bobot. Kami sering menduga Google melakukan hal sebaliknya