Pulse · AI 뉴스

토큰 공간 마스크 예측: 효율적인 비전 트랜스포머 세그멘테이션

TokenMask · 2026-05-18

연구진은 이미지 공간 재구축 없이 토큰 공간에서 직접 마스크 예측을 수행하는 TokenMask를 제안했어요. TokenMask는 기존 방식보다 계산 구조를 단순화하고 메모리 요구량을 줄여 효율성을 높여요. 다양한 비전 트랜스포머 백본과 데이터셋에서 TokenMask는 정확도 손실 없이 성능을 유지하며 속도 향상을 이끌어냈어요.

TokenMask는 쿼리-토큰 친화도에서 마스크 로짓을 계산하고, 이미지 공간 대신 로짓 공간에서 보간을 수행하는 방식으로 작동해요. 이 방식은 기존 선형 스코어링 메커니즘을 유지하면서도 계산 구조를 간소화합니다. NVIDIA Jetson AGX Orin에서 TensorRT FP16 추론 시 상당한 속도 향상을 보여줬어요.

연구 결과, TokenMask는 임베디드 비전 시스템에 더 간단하고 배포하기 쉬운 디자인을 제공하며, 다양한 비전 트랜스포머 백본, 데이터셋, 세그멘테이션 작업에서 효율성을 개선하는 것으로 나타났습니다.

##비전트랜스포머##세그멘테이션##TokenMask##임베디드비전
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기