Pulse · AI 뉴스

DyCo-RL: 시각적 추론을 위한 동적 교차 모드 조정

Qwen · 2026-06-06

연구진은 기존 RLVR 방법이 추론 결과에만 집중하여 시각적 증거 추출과 텍스트 맥락 종합 간의 동적 교차 모드 조정 부족을 간과한다는 점을 밝혀냈습니다.

DyCo-RL은 Fisher-Rao 기하선 거리로 모달 간 주의력 변화를 측정하고, 토큰을 시각 지향 또는 텍스트 지향 기능 역할로 지정하여 동적 교차 모드 조정을 RLVR 최적화에 통합합니다.

DyCo-RL을 Qwen2-5-VL-3B/7B에 적용한 결과, 시각 중심 및 수학적 추론 벤치마크에서 대표적인 4가지 RLVR 알고리즘의 성능을 향상시켰습니다.

##시각적추론##RLVR##MLLM##DyCo-RL
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기