Pulse · AI 뉴스

로봇 팔 제어 시 이중 평가 함수 구조가 더 효과적

NVIDIA · 2026-06-10

연구진이 인간형 로봇의 보행과 조작을 동시에 제어하는 강화 학습에서 단일 평가 함수 대신 이중 평가 함수 구조가 더 효과적임을 확인했어요. NVIDIA Isaac Lab 환경에서 로봇 팔 제어 훈련 결과, 이중 평가 함수는 목표 도달 속도가 3.5배 빠르고 처리량은 2배 높았으며 성공률도 향상됐어요. 이중 평가 함수 구조는 기존의 로봇 제어 방식에서 간과된 중요한 설계 요소로, 기존 행동을 억제하지 않으면서 성능을 개선할 수 있어요.

연구진은 로봇 팔 제어 훈련 결과, 이중 평가 함수를 사용할 경우 목표 도달 속도가 3.5배 빠르고 처리량은 2배 높았으며 성공률도 향상됐다고 밝혔어요. 특히, 추가적인 보상 설계는 성능 향상에 큰 영향을 미치지 않았어요. 이중 평가 함수 구조는 기존의 로봇 제어 방식에서 간과된 중요한 설계 요소로, 기존 행동을 억제하지 않으면서 성능을 개선할 수 있어요.

단일 평가 함수는 보행과 조작 목표 간의 경쟁적인 기울기로 인해 기존의 학습된 행동을 억제할 수 있지만, 이중 평가 함수는 이러한 문제를 해결하여 로봇의 효율성을 높일 수 있어요. 연구 결과는 모방 학습된 정책을 강화 학습으로 개선하는 데 중요한 시사점을 제공하며, 평가 함수 구조 선택이 로봇 제어 성능에 미치는 영향을 강조해요.

##로봇##강화학습##인공지능##보행##조작
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기