연구진은 텍스트-이미지 생성 모델을 인간 선호도에 맞추기 위한 새로운 프레임워크 AutoRubric-T2I를 제안했어요. AutoRubric-T2I는 VLM 판별사를 위한 명시적 규칙(rubric)을 자동으로 합성하고 선택하여, 기존 방식보다 적은 데이터로 고품질의 보상 신호를 생성해요. MMRB2 벤치마크에서 기존 보상 모델보다 성능이 뛰어나고, TIIF 및 UniGenBench++와 같은 다운스트림 작업에서 생성 품질을 향상시켰어요.