연구진은 디지털 병리 AI 코파일럿의 성능을 평가하기 위해 DALPHIN이라는 멀티센터 오픈 벤치마크를 만들었어요. GPT-5, Gemini 2.5 Pro, PathChat+ 등 다양한 코파일럿을 평가한 결과, PathChat+는 6가지 작업 중 4가지에서 전문가 수준의 성능을 보였어요. DALPHIN 데이터와 평가 플랫폼은 dalphin.grand-challenge.org에서 공개되어 지속적인 벤치마킹을 지원할 예정입니다.