Aujourd'hui, nous lançons Power Retention, une nouvelle architecture au-delà des Transformers.
Elle permet aux LLM de gérer des millions de tokens de manière efficace, débloquant des applications à long contexte qui étaient trop coûteuses auparavant.