연구진이 사진 촬영 시 카메라 구도와 피사체 포즈를 돕는 MLLM의 가능성을 탐색하기 위해 CaptureGuide-Bench 벤치마크를 발표했어요.
벤치마크 결과, 기존 MLLM은 구도 결정은 가능하지만 정확한 위치 조정이 어렵고, 미적 감각 모델은 위치 조정은 뛰어나지만 포즈 가이드가 불가능했어요.
ShutterMuse는 사진 촬영 시 구도 결정과 위치 조정, 피사체 포즈 추천을 모두 지원하며, 기존 모델보다 저렴한 비용으로 경쟁력 있는 성능을 보여줬어요.