Pulse · AI 뉴스

SM1: Mamba1 변형 모델, Blackwell에서 PyTorch로 구동

Mamba1 · 2026-05-23

TechnoVoyager 사용자가 Mamba1 변형 모델 SM1을 개발하여 Blackwell 환경에서 순수 PyTorch로 실행 가능함을 공개했어요.

SM1은 선택적 스캔을 대체하여 메모리 사용량을 16배 줄였으며, d_state=1일 때 정확한 닫힌 형태의 해를 제공해요.

130M 파라미터 모델의 추론 상태는 약 56KB로, KV 캐시 없이 토큰당 O(1)의 성능을 유지하며 16GB RTX 5060 Ti에서 실행 가능해요.

##Mamba##SM1##PyTorch##Blackwell
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기