Pulse · AI 뉴스

RankE: 디스크리트 텍스트-이미지 생성 모델의 엔드투엔드 후처리

LlamaGen-XL · 2026-05-20

연구진은 디스크리트 텍스트-이미지 생성 모델에서 정책 최적화만으로는 이미지 품질 저하를 유발하는 '잠재된 공변량 이동' 현상을 발견했어요.

RankE는 정책과 디코더를 함께 최적화하는 새로운 프레임워크로, 디코더의 안정성을 유지하며 순위 기반 정렬 목표를 최대화하는 방식으로 작동해요.

LlamaGen-XL 모델에서 RankE는 CLIP 점수와 FID 점수를 동시에 향상시켜 기존 방식의 품질 저하 문제를 해결하고, Janus-Pro 모델에서도 일관된 성능 향상을 보였어요.

##텍스트이미지##RankE##디스크리트모델
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기