하버드 연구에서 OpenAI의 o1 추론 모델이 응급실 초기 분류 진단에서 인간 의사보다 높은 정확도를 보였습니다. 보스턴 병원 응급실 환자 76명의 전자의무기록을 읽고 진단했습니다. LLM은 임상 추론의 대부분 벤치마크를 넘어섰습니다.