Pulse · AI 뉴스

LLM의 시각적 의미 연산 능력 강화: 새로운 접근법 제시

arXiv cs.AI · 2026-04-22

연구진은 로봇이 이미지에서 의미 관계를 추론하는 시각적 의미 연산 능력을 향상시키기 위한 새로운 방법론을 제시했어요.

Image-Relation-Pair Dataset (IRPD)을 구축하고, Semantic Arithmetic Reinforcement Fine-Tuning (SAri-RFT) 기법을 통해 LVLM의 성능을 향상시켰어요.

SAri-RFT는 검증 가능한 함수와 Group Relative Policy Optimization (GRPO)를 활용하여 IRPD와 Visual7W-Telling 데이터셋에서 최고 성능을 달성했어요.

##시각적추론##로봇공학##강화학습

매일 핵심 AI 소식을 한국어로, 빠르게