Étude intéressante. Beaucoup de commentaires sur des modèles obsolètes semblent manquer le point : les modèles étaient suffisants en eux-mêmes pour le benchmarking, mais ne pouvaient pas inciter de vrais utilisateurs humains à décrire avec précision leurs conditions.