Qualcuno ha effettivamente condotto uno studio decente sulla fornitura di assistenza nel mondo reale che possa servire come base per valutare i LLM che forniscono assistenza? La maggior parte del comportamento dei fornitori ha poco a che fare con le linee guida stabilite o uno standard ideale di assistenza, quindi non dovrebbe essere quella la base.