연구진이 뇌 자기공명영상(fMRI) 신호만으로 시각적 질문에 답하는 Brain-IT-VQA 프레임워크를 공개했어요. Brain-IT 모델을 기반으로 언어 토큰을 해독하고 언어 모델과 통합하여 시각적 질문에 답하며 기존 방식보다 성능이 향상됐어요. NSD-VQA라는 새로운 데이터셋과 벤치마크를 함께 공개하여 뇌의 시각적 표현 구조를 연구하는 데 활용할 수 있도록 지원해요.