연구진은 이미지 생성, 로봇 공학, 3D 이해에 활용되는 장면 그래프 생성 모델을 개발했습니다. 기존 모델은 장면 그래프의 계층 구조와 의존성을 제대로 반영하지 못하는 한계가 있었습니다.
새로운 모델은 구조와 의미를 분리하여 조건부 의존성을 포착하고, 텍스트에 맞춰 장면 그래프를 샘플링하는 방식을 사용합니다.
표준 장면 그래프 벤치마크에서 기존 모델보다 성능이 향상되었으며, 이미지 생성 시 여러 객체가 포함된 상황에서 더 나은 결과가 나타났습니다.