연구진은 LLM이 인간의 주의 맹점과 유사하게 중요한 맥락적 단서를 놓칠 수 있다는 점을 조사하기 위해 MixRea 벤치마크를 발표했어요. MixRea는 9가지 추론 유형으로 구성된 2,246개의 객관식 문제로, 명시적 정보와 암묵적 정보의 분포가 다양해요.
Gemini 2.5 Pro를 포함한 21개의 LLM을 평가한 결과, 일관성 점수가 42.8%에 불과했는데, 이는 LLM이 중요한 정보를 간과하는 '주의 맹점'을 가지고 있음을 보여줘요.
연구진은 PRCP라는 새로운 프롬프팅 방법을 제안하여 LLM의 추론 능력을 개선했는데, PRCP는 간과된 인과 관계를 회복하는 데 도움을 줘요.