LFM2.5 230M 모델이 WebGPU 커널을 활용해 브라우저 내에서 1,400 토큰/초 속도로 실행돼요. Fable 5 팀이 개발한 커널과 Opus 4.8이 사용됐으며, M4 Max에서 테스트했어요. LiquidAI의 LFM2.5-230M (GGUF) 모델을 사용하며, Hugging Face Spaces에서 데모를 확인할 수 있어요. 사용자 xenovatech이 Reddit에 관련 내용을 공유했어요.