¿Alguien ha realizado un estudio decente sobre la entrega de atención en el mundo real que pueda servir como base para evaluar a los LLMs que brindan atención? La mayoría del comportamiento de los proveedores tiene poco que ver con las pautas establecidas o un estándar idealizado de atención, por lo que esa no debería ser la base.