대역폭 제약 환경에서 로봇 시스템은 장면 인식과 객체 인식을 위해 단일 압축 동영상 스트림에 의존하는데요, 이로 인해 저비트레이트 동영상은 움직임과 전체적인 맥락을 유지하지만 객체 인식에 필요한 세부적인 로컬 디테일이 손실되는 문제가 발생했어요.
연구에서는 저해상도 동영상이 동적 장면 이해를 지원하고, 이벤트 기반의 고해상도 관심 영역(ROI) 스틸 이미지가 세부적인 식별 및 분석을 지원하는 하이브리드 아키텍처를 제안하며, HEVC와 JPEG 코덱을 활용한 실용적인 텔레메트리 방식을 제시했어요.
실험 결과, 하이브리드 방식은 동영상만 사용하는 방식과 비교하여 객체 수준의 분류 정확도를 향상시켰으며, 향후 JPEG AI를 활용한 추가 연구의 기반을 마련했습니다.