본 연구는 환자 안전을 위한 임상 기록에서 중요한 조치 추출을 위해 제로샷 및 퓨샷 대규모 언어 모델(LLM)을 평가합니다.
복잡한 임상 기록을 처리하기 위해 두 단계 추출 프레임워크를 도입하여 단계별 프롬프팅 전략을 통해 상세한 임상 작업을 추출합니다.
연구 결과, LLM은 감독 모델과 유사하거나 뛰어난 성능을 보이지만, 세분화된 다중 레이블 분류에서는 감독 모델이 여전히 우위를 점하며, 이는 임상 추론 부족으로 인한 모델의 한계점을 시사합니다.