Pulse · AI 뉴스

AttnRouter: Qwen 기반 이미지 편집 시 카테고리별 주의 집중 방식 연구

Qwen · 2026-05-03

연구진은 Qwen-Image-Edit-2511 모델에서 이미지 편집 시 주의 집중 방식을 개선하는 KVInject 기법을 소개했습니다. KVInject는 기존 방식보다 간단하며, 프롬프트 불일치 문제를 해결합니다. AttnRouter는 편집 유형에 따라 최적의 주의 집중 방식을 선택하여 CLIP-T+DINO-I 복합 성능을 6.4% 향상시켰습니다.

연구 결과, 이미지 편집에 효과적인 주의 집중 회로는 초기 디노이징 단계에서 K/V 주입이 중요하며, 특정 레이어 및 알파 값 범위가 효과적임을 확인했습니다. 단순 K/V 재조정은 효과가 없으며, 과도한 변형은 생성 결과를 망칠 수 있습니다.

연구진은 코드, 미리 계산된 라우팅 테이블, 그리고 ImgEdit-Bench의 하위 집합을 공개했습니다.

##이미지편집##MMDiT##AttnRouter##Qwen##딥러닝
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기