Pulse · AI 뉴스

RankE: 디스크리트 텍스트-이미지 생성 모델의 엔드투엔드 후처리

LlamaGen-XL · 2026-05-20

연구진은 디스크리트 텍스트-이미지 생성 모델에서 정책 최적화만으로는 이미지 품질 저하를 초래하는 '잠재된 공변량 이동' 현상을 발견했어요.

RankE는 정책과 디코더를 함께 최적화하는 새로운 프레임워크로, 디코더의 안정성을 유지하며 순위 기반 정렬 목표를 최대화하는 방식으로 작동해요.

RankE를 적용한 LlamaGen-XL 모델은 CLIP 점수와 FID 점수를 동시에 향상시켰으며, Janus-Pro 모델에서도 일관된 성능 향상을 보였어요.

##텍스트이미지##디스크리트##RankE##LlamaGen##JanusPro
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기