Pulse · AI 뉴스

DeepGaze3.5-VL: 시선 예측 모델, MIT1003 데이터셋에서 46% 성능 향상

DeepGaze3.5-VL · 2026-07-02

연구진이 시선 예측 모델 DeepGaze3.5-VL을 개발했어요. 이 모델은 시선 예측을 텍스트 시퀀스 모델링 문제로 접근했어요. MIT1003 데이터셋에서 기존 모델보다 46% 향상된 2.18 bits의 정보 획득량(IG)을 달성했어요. 시선 예측 외에도 실험하기 어려운 행동 개입 시뮬레이션에도 활용 가능해요.

DeepGaze3.5-VL은 시청자 정보나 특정 목표를 프롬프트로 넣어 개인화된 시선 패턴을 반영할 수 있어요. 시선 지속 시간과 같은 속성도 함께 모델링할 수 있어요.

기존 모델의 구조적 제약 없이 다양한 요소를 통합할 수 있다는 장점이 있어요.

연구 결과는 시선 예측 기술 발전과 더불어 인터페이스 디자인, 인지 상태 추론 등 다양한 분야에 기여할 것으로 기대돼요.

##시선추적##인공지능##컴퓨터비전

매일 핵심 AI 소식을 한국어로, 빠르게

App Store 에서 Pulse 받기 앱에서 열기