연구진은 다중 모드 대규모 언어 모델(MLLM)의 임상 추론 능력을 평가하는 X-PCR 벤치마크를 새롭게 선보였어요. X-PCR은 안과 진단 워크플로우를 통해 점진적 추론과 다중 모드 통합 능력을 평가하는 최초의 종합적인 평가 도구예요. 21개의 MLLM 평가 결과, 점진적 추론과 다중 모드 통합에 중요한 격차가 존재한다는 사실이 밝혀졌어요.