Pulse · AI 뉴스

3D 세계의 시각적 질의 위치 추적을 위한 새로운 벤치마크 공개

3DVQL · 2026-05-03

연구진은 3D 공간에서 시각적 질의 위치 추적(VQL)을 다루는 새로운 벤치마크 '3DVQL'을 공개했습니다. 3DVQL은 38개 객체 범주에 걸쳐 약 17만 프레임과 6,400개의 응답 트랙 세그먼트를 포함합니다. 이 벤치마크는 포인트 클라우드, RGB 이미지, 깊이 이미지 등 다양한 모달리티를 제공하여 연구의 유연성을 지원합니다.

3DVQL은 수차례의 검증 및 수정을 거쳐 고품질의 어노테이션을 보장하며, 기존 방법들이 퓨전 모듈에 따라 성능 편차가 크다는 것을 보여주었습니다. 연구진은 LaF라는 리프트 앤 어텐션 퓨전 알고리즘을 제안하여 기존 모델보다 성능을 향상시켰습니다.

3DVQL 벤치마크와 모델은 GitHub를 통해 공개될 예정이며, 향후 연구를 장려하기 위한 노력의 일환입니다.

##3D##벤치마크##시각적질의위치추적##VQL
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기