Pulse · AI 뉴스

SmolLM2-135M-Q8: Roblox Native 환경에서 초당 약 7 토큰 처리

SmolLM2 · 2026-04-18

Roblox Native 환경에서 SmolLM2-135M 모델을 사용하여 초당 약 7토큰의 속도로 추론이 가능함을 개발자가 공유했습니다.

Luau 언어의 연산 처리 속도 제한으로 인해 Q4 양자화 및 코어 분할을 시도했으나, 오히려 성능 저하를 야기했습니다.

향후 Roblox의 멀티스레딩 기능을 활용할 수 있는 소형 확산 모델 테스트를 계획하고 있습니다.

##Roblox##LLM##Luau
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기