TechnoVoyager 사용자가 Mamba1 변형 모델 SM1을 개발하여 Blackwell 환경에서 순수 PyTorch로 실행 가능함을 공개했어요. SM1은 선택적 스캔을 대체하여 메모리 사용량을 16배 줄였으며, d_state=1일 때 정확한 닫힌 형태의 해를 제공해요. 130M 파라미터 모델의 추론 상태는 약 56KB로, KV 캐시 없이 토큰당 O(1)의 성능을 유지하며 16GB RTX 5060 Ti에서 실행 가능해요.