Pulse · AI 뉴스

ArchEHR-QA 2026: 프롬프트 엔지니어링으로 LLM 평가, MedGemma 3 27B 우수한 성능

MedGemma · 2026-05-05

BIT.UA-AAUBS 그룹이 ArchEHR-QA 2026에서 임상 질문 답변 및 근거 기반 작업을 수행하며 LLM을 평가했어요. 개인정보 보호 제약으로 인해 모델 가중치 업데이트 없이 프롬프트 엔지니어링 전략을 활용했답니다.

Chain-of-Thought, in-context learning 등 다양한 프롬프트 전략을 사용했으며, MedGemma 3 27B와 같은 도메인 특화 오픈소스 모델이 좋은 성능을 보였어요.

Subtask 4에서 1위, Subtask 3에서 3위를 달성했으며, 관련 코드와 프롬프트는 GitHub에서 확인할 수 있답니다.

##LLM##프롬프트엔지니어링##ArchEHR-QA
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기