NVIDIA aurait contacté directement Anna's Archive pour accéder à environ 500 téraoctets de livres et d'articles "piratés" pour pré-entraîner leurs LLM. Anna's les a avertis que les collections étaient illégales et protégées par des droits d'auteur. L'équipe de stratégie de données de NVIDIA a insisté malgré tout ; les dirigeants ont donné le feu vert en quelques jours, selon des documents internes cités dans le procès.