Nieuwe categorie van llm benchmarks.