연구진은 로봇 조작 성능 향상을 위해 관절 부위 인식을 위한 새로운 표현법인 GPS(Geometric Primary Structure)를 제안했어요. GPS는 VR 기기를 활용해 1분 안에 객체 시퀀스를 어노테이션할 수 있도록 설계되어 기존 방식보다 높은 품질의 데이터를 제공해요.
GPS 모델은 단일 RGB-D 객체 이미지를 입력으로 받아 학습되며, 73%의 성공률로 9개의 객체에 대한 270개 초기 상태를 커버했어요. 이는 도메인별 미세 조정 없이 달성한 결과예요.
연구진은 코드, 데이터, 재사용 가능한 도구를 GitHub에서 공개했으며, 로봇 조작 분야의 관절 부위 인식 연구에 기여할 것으로 기대돼요.