Pulse · AI 뉴스

멀티태스크 비전-언어 모델의 인과적 귀속 및 조향: 헤드 중심의 신경원 설명 및 조향

arXiv cs.CL · 2026-04-20

최근 연구에서는 비전-언어 모델(VLM)의 신경원 수준 해석을 통해 최종 예측에 중요한 신경원을 파악하는 데 집중하고 있어요.

HONES는 멀티태스크 VLM에서 작업 관련 주의 헤드에 조건부로 신경원의 인과적 기여도를 평가하고, 경량화된 스케일링을 통해 중요한 신경원을 조작하는 프레임워크예요.

다양한 멀티모달 작업과 인기 VLM에 대한 실험 결과, HONES는 작업에 중요한 신경원을 식별하고 모델 성능을 향상시키는 데 기존 방법보다 우수한 성능을 보였어요.

##모델출시##비전언어모델##인공지능
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기