연구진은 다중 모드 LLM(MLLM)이 공간 추론 문제에서 실패하는 새로운 원인으로 공간 어휘 편향을 발견했어요. 답안 옵션에 공간 관계 단어를 추가하면 모델이 해당 옵션을 선택할 가능성이 높아져요.
9개의 오픈 웨이트 MLLM을 분석한 결과, 이 현상은 널리 관찰되었으며, 모델은 이분법적 질문에는 정답을 맞히지만 삼자택 시에는 틀리는 경우가 많았어요.
시각 정보가 아닌 언어 모델 내부의 특정 채널과 뉴런에서 편향이 발생한다는 것을 확인했으며, LLM-전용 DPO 업데이트를 통해 성능을 향상시켰어요.