연구진은 풍부한 2D 의료 이미지를 활용한 근거 추론 지도 학습이 3D 의료 영상 질의응답 성능을 향상시킬 수 있는지 연구했어요.
UniReason-Med 프레임워크는 2D 이미지 또는 3D 볼륨을 처리하여 공유된 박스 구문, 영역 토큰 주입, 근거 추론 정책을 통해 텍스트 추론과 시각적 증거를 생성해요.
UniReason-Med는 2D+3D 데이터 혼합 학습을 통해 3D 추론 성능을 향상시켰으며, 근거 추론과 영역 토큰 주입은 2D 및 3D 작업 모두에 도움이 되는 것으로 나타났어요.