연구진이 3D 가상 사진 촬영을 위한 PhotoFlow 에이전트를 공개했어요. PhotoFlow는 Director, Reviewer, Reflector 세 가지 역할을 수행하며, 3D 공간 이해와 미적 판단 능력을 평가하는 데 중점을 뒀어요.
새로운 벤치마크 VPhotoBench를 함께 공개했는데, 47개의 Blender 씬과 141개의 촬영 미션을 포함하고 있어요. VPhotoBench는 피사체 배치, 관계 구성, 분위기/스타일을 다룹니다.
PhotoFlow는 6번의 렌더링 예산 내에서 다른 방법들보다 높은 품질과 성공률을 기록했어요. LLM 기반 에이전트가 3D 추론과 미적 선택을 요구하는 환경에서 뛰어난 사진을 생성할 수 있음을 보여줍니다.