Roblox Native 환경에서 SmolLM2-135M 모델을 사용하여 초당 약 7토큰의 속도로 추론이 가능함을 개발자가 공유했습니다. Luau 언어의 연산 처리 속도 제한으로 인해 Q4 양자화 및 코어 분할을 시도했으나, 오히려 성능 저하를 야기했습니다. 향후 Roblox의 멀티스레딩 기능을 활용할 수 있는 소형 확산 모델 테스트를 계획하고 있습니다.