Как академик, я сочувствую, так как публикация занимает время, и трудно успевать за передовыми моделями, но... ...особенно если ваш аргумент заключается в том, что "AI плох в X", вам нужно объяснить, почему вы думаете, что это не изменится, построить график любой тенденции по мере улучшения и обновления моделей перед публикацией.
Kevin Roose
Kevin Roose14 часов назад
Я умоляю ученых изучить возможности ИИ, используя передовые модели. Модели, использованные в этом исследовании (которое будет цитироваться в течение многих лет как доказательство того, что "ИИ плох в медицинских советах"), это GPT-4o, Llama 3 и Command R+, две устаревшие модели и одна, о которой я никогда не слышал.
На самом деле в статье есть две большие реальные точки, однако: (1) Люди плохо справлялись с запросами (устаревшего) ИИ для получения медицинских советов - я подозреваю, что это уже не так верно. (2) Бенчмарки медицинских знаний не всегда отражают реальность в обслуживании пациентов. 1 изменилось, я думаю, 2 - нет.
223