有没有人实际上对当前现实世界的护理交付做过一个体面的研究,以作为评估 LLM 提供护理的基准?大多数提供者的行为与既定指南或理想化的护理标准关系不大,因此这不应该是基准。