연구진이 복합 텍스트-이미지 생성 성능을 높이는 BiDPO 프레임워크를 제안했어요. BiDPO는 엄격한 품질 관리를 거친 대규모 선호 데이터셋 BiComp을 활용하고, 이미지와 텍스트 선호도를 함께 최적화하는 Diffusion DPO를 확장했어요. 지역 수준의 가이드 방법을 적용해 세밀한 정렬을 강화했어요.
기존 방식보다 여러 벤치마크에서 성능이 뛰어나다는 결과가 나왔어요. BiDPO는 복합 텍스트-이미지 작업에 대한 선호 기반 미세 조정의 가능성을 보여줘요.
BiDPO는 기존 기술에 대한 유연하고 확장 가능한 대안을 제공하며, 복잡한 텍스트 프롬프트를 따르는 모델의 능력을 향상시킬 수 있어요.