Pulse · AI 뉴스

PolarVLM: 시각-언어 모델의 의미-물리적 간극을 해소하다

PolarVLM · 2026-05-08

PolarVLM은 시각-언어 모델의 광학적 모호성 문제를 해결하기 위해 편광 이미징 데이터를 통합한 최초의 프레임워크입니다.

PolarVLM은 이중 스트림 아키텍처와 점진적인 2단계 학습 전략을 통해 물리적 오해를 방지하고 일반적인 시각 능력을 유지합니다.

PolarVLM은 편광 인지 VQA 벤치마크 PolarVQA를 함께 구축하여 반사 인식 및 유리 계수에서 각각 26.6%, 34.0%의 성능 향상을 보였습니다.

##시각언어모델##편광이미징##PolarVLM##VQA
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기