연구진은 시각 정보와 물리적 행동을 연결하여 로봇 조작을 돕는 어포던스 기반 모델 'AFUN'을 개발했어요. AFUN은 RGB-D 이미지와 언어적 작업 설명을 바탕으로 상호작용 위치(기능 마스크)와 3D 접촉 후 움직임 곡선을 예측해요. 다양한 환경, 객체, 작업에 대한 일반화 성능을 높이기 위해 로봇, 사람, 시뮬레이션, 실제 환경 데이터를 활용한 대규모 데이터 파이프라인을 구축했어요.