연구진이 시각적으로 풍부한 환경에서 도구를 창의적으로 사용하는 능력 평가를 위한 벤치마크 MM-CreativityBench를 발표했어요. 현재 LMM은 패턴 인식 능력이 뛰어나지만, 현실 세계의 문제를 해결하는 데 어려움을 겪으며, 관련 요소들을 간과하거나 속성을 환각하는 경향이 있어요. 연구진은 속성-활용성 추론을 장려하는 속성 기반 정렬과 지식 기반 감독을 통해 모델의 성능을 개선했으며, 환각과 접지 관련 오류를 줄이는 데 성공했어요.