A NVIDIA supostamente entrou em contato diretamente com o Anna's Archive para obter acesso a ~500 terabytes de livros e artigos "pirateados" para pré-treinamento de seus LLMs Anna os alertou que as coleções eram ilegais e protegidas por direitos autorais. Mesmo assim, a equipe de estratégia de dados da NVIDIA insistiu; Os executivos deram sinal verde em poucos dias, conforme documentos internos citados no processo.