연구진이 다중 회전 이미지 편집의 한계를 극복하기 위해 강화 학습 프레임워크 MT-EditFlow를 공개했어요.
MT-EditFlow는 회전별 보상 신호를 최적화하여 순차적 이미지 편집을 위한 통합 구조를 제공하며, GRPO와 NFT 기반 강화 학습 방법 모두에 적용 가능해요.
실험 결과 MT-EditFlow는 FLUX.1-Kontext-dev에서 6.85점 성능 향상을 보여 Qwen-Image-Edit를 능가했으며, 높은 성공률과 노출 편향 감소를 달성했어요.
MT-EditFlow는 시각 콘텐츠 제작 분야에서 인간-AI 협업의 기반을 마련할 것으로 기대돼요.