Pulse · AI 뉴스

GIM-World: 비디오 월드 모델을 위한 기하학 기반 암묵적 메모리

GIM-World · 2026-06-02

GIM-World는 비디오 월드 모델의 장기적인 시뮬레이션 성능을 향상시키는 기하학 기반 암묵적 메모리 프레임워크입니다. 기존 방식의 문제점을 해결하기 위해 가벼운 트랜스포머 인코더와 카메라 기반 기하학 정보 추출 기술을 사용합니다. MIND 데이터셋 실험 결과, 기존 방식 대비 장기적인 기하학적·시각적 일관성을 더 잘 유지하는 것으로 나타났습니다.

GIM-World는 가변 길이의 과거 정보를 고정 크기의 메모리 토큰으로 압축하고, 훈련 과정에서 기반 모델로부터 3D 장면 구조를 추출하여 메모리에 저장합니다. 훈련에 사용된 기하학 정보 추출 모듈은 추론 시 제거되어 가벼운 메모리 모듈만 남게 됩니다.

기존 방식의 명시적 메모리는 정보 검색 오류, 불필요한 저장 공간, 재구성 오류 등의 문제가 있었고, 암묵적 메모리는 교차 뷰 장면 기하학적 제약이 부족했습니다. GIM-World는 이러한 문제점을 해결하여 비디오 월드 모델의 성능을 향상시킵니다.

##비디오월드모델##암묵적메모리##기하학##GIM-World
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기