Pulse · AI 뉴스

대규모 다중 모드 모델의 창의적 물리적 지능 발전

MM-CreativityBench · 2026-05-25

연구진이 시각적으로 풍부한 환경에서 도구를 창의적으로 사용하는 능력 평가를 위한 벤치마크 MM-CreativityBench를 발표했어요.

현재 LMM은 패턴 인식 능력이 뛰어나지만, 현실 세계의 문제를 해결하는 데 어려움을 겪으며, 관련 요소들을 간과하거나 속성을 환각하는 경향이 있어요.

연구진은 속성-활용성 추론을 장려하는 속성 기반 정렬과 지식 기반 감독을 통해 모델의 성능을 개선했으며, 환각과 접지 관련 오류를 줄이는 데 성공했어요.

##LMM##MM-CreativityBench##인공지능
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기