Pulse · AI 뉴스

장시간 영상 이해를 위한 선형 스케일링 비디오 VLM

StateKV · 2026-05-29

연구진이 StateKV라는 새로운 방법을 제시하여 장시간 영상 VLM의 처리 속도를 향상시켰어요. StateKV는 중요도 기반 순환 상태를 활용해 프레임 수를 늘려도 계산량이 선형적으로 증가하도록 설계됐어요. 세 가지 벤치마크에서 기존 방식보다 성능이 뛰어나고, 더 큰 모델을 사용할 수 있게 해줘 정확도를 높일 수 있어요.

StateKV는 사전 훈련된 모델에 적용 가능하며, 추가적인 튜닝이나 구조 변경 없이도 기존 방식보다 우수한 성능을 보여줘요. 이는 장시간 영상 이해 분야의 실질적인 발전을 의미합니다.

StateKV는 프레임 간의 문맥을 고정 용량의 순환 상태로 유지하며, 디코딩을 위한 별도의 전체 프레임 캐시와 함께 사용돼 계산 비용을 줄이고 정확도를 향상시킵니다.

##VLM##영상처리##StateKV##인공지능
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기