Pulse · AI 뉴스

이미지 정교화, 재생성 방식이 더 효과적: 수정 공간 확장으로 통합 멀티모달 모델의 이미지 정교화 성능 향상

arXiv cs.CV · 2026-04-28

연구진은 통합 멀티모달 모델(UMM)의 이미지 정교화 성능을 높이기 위해 새로운 프레임워크인 Refinement via Regeneration (RvR)을 제안했어요.

RvR은 기존의 편집 기반 정교화 방식에서 벗어나, 초기 이미지의 의미 토큰을 활용하여 새로운 이미지를 생성하는 재생성 방식이에요.

실험 결과, RvR은 Geneval, DPGBench, UniGenBench++ 등 다양한 벤치마크에서 기존 방식보다 훨씬 높은 성능을 보여줬어요.

##이미지정교화##멀티모달모델##이미지생성##RvR##UMM
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기