Evo-PI는 정적인 지도 방식의 한계를 극복하기 위해 원칙 기반 학습 프레임워크를 제안합니다. 원칙은 언어 기반의 지도 신호로, 생성·평가·반복 개선을 통해 모델의 추론 과정을 형성합니다.
의료 시각 질의 응답에 Evo-PI를 적용한 결과, 8개 벤치마크에서 추론 정확도가 최대 24.6% 향상되었습니다.
Evo-PI는 MLLM의 전문가 수준의 추론 훈련을 위한 확장 가능하고 일반적인 패러다임을 제시합니다. 코드는 GitHub에서 확인할 수 있습니다.