연구진은 로봇 학습 시 시너지 그래프(Scene Graphs)를 활용한 구조화된 이미지 표현(SIR) 방법을 제안했어요. SIR은 로봇 정책 학습을 위한 중간 표현으로, 이미지에서 파생된 특징을 초기 노드 표현으로 사용해 완전 연결 그래프를 구축해요.
SIR은 학습 과정에서 그래프를 희소화하여 작업 관련 서브 그래프를 생성하고, 이를 액션 생성 모델에 전달하여 모델의 설명 가능성을 높여요. RoboCasa 환경에서 기존 이미지 기반 방식보다 평균 성공률이 19.5%로 높게 나타났어요.
학습된 희소 그래프 분석을 통해 데이터셋 편향을 발견할 수 있었으며, 이는 모델 분석을 위한 강력한 도구로 활용될 수 있음을 입증했어요.