연구진이 임상 추론을 위한 새로운 에이전트 프레임워크 ClinSeekAgent를 공개했어요. ClinSeekAgent는 LLM이 능동적으로 증거를 수집하고 통합하여 임상 의사 결정을 내리는 방식에 초점을 맞추고 있어요.
ClinSeekAgent는 의료 지식 베이스를 검색하고, EHR을 탐색하고, 의료 영상 도구를 활용하여 증거를 수집하며, 새로운 정보에 따라 가설을 수정해요.
ClinSeekAgent는 Claude Opus 4.6의 F1 점수를 텍스트 기반 EHR 작업에서 60.0에서 63.2로 향상시켰고, 다중 모드 작업에서는 47.5에서 62.6으로 개선했어요.
ClinSeekAgent는 에이전트의 증거 수집 경로를 작은 오픈 소스 모델로 변환하는 훈련 파이프라인으로도 활용돼, AgentEHR-벤치마크에서 평균 F1 점수를 34.0으로 달성했어요.