Pulse · AI 뉴스

토큰 선택 가이드: 비주얼 지오메트리 트랜스포머

Visual Geometry Transformers · 2026-05-23

연구진은 비주얼 지오메트리 트랜스포머의 연산 비용 증가 문제를 해결하기 위해 토큰 선택 전략을 제안했어요.

토큰 선택은 프레임 수준의 인터 프레임 선택과 프레임 내의 인트라 프레임 선택의 2단계로 구성돼요.

인터 프레임 선택은 장면의 다양한 시점을 확보하는 다양성 기반 전략을 사용하고, 인트라 프레임 선택은 레이어별 희소화를 통해 전역 어텐션 패턴 엔트로피를 활용해요.

제안된 방법은 기존 방식보다 속도와 정확도 측면에서 우수하며, 500장의 이미지 장면에서 85% 이상의 속도 향상을 달성했어요.

##비주얼지오메트리트랜스포머##토큰선택##3D재구성
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기