연구진이 시선 예측 모델 DeepGaze3.5-VL을 개발했어요. 이 모델은 시선 예측을 텍스트 시퀀스 모델링 문제로 접근했어요. MIT1003 데이터셋에서 기존 모델보다 46% 향상된 2.18 bits의 정보 획득량(IG)을 달성했어요. 시선 예측 외에도 실험하기 어려운 행동 개입 시뮬레이션에도 활용 가능해요.
DeepGaze3.5-VL은 시청자 정보나 특정 목표를 프롬프트로 넣어 개인화된 시선 패턴을 반영할 수 있어요. 시선 지속 시간과 같은 속성도 함께 모델링할 수 있어요.
기존 모델의 구조적 제약 없이 다양한 요소를 통합할 수 있다는 장점이 있어요.
연구 결과는 시선 예측 기술 발전과 더불어 인터페이스 디자인, 인지 상태 추론 등 다양한 분야에 기여할 것으로 기대돼요.