연구진은 멀티모달 모델 학습 데이터 선택의 효율성과 해석 가능성을 높이는 One-Step-Train (OST) 프레임워크를 제안했습니다. OST는 데이터 선택을 점진적 최적화 유틸리티 순위 문제로 재구성하여, LLM-as-a-Judge 방식의 높은 계산 비용과 해석 불가능성을 개선했습니다. Qwen 시리즈를 활용한 실험 결과, OST는 학습 비용을 43% 절감하고, 기존 방식 대비 5.6점의 성능 향상을 달성했습니다.