Pulse · AI 뉴스

LFM2.5 230M 브라우저 내 실행, WebGPU 커널 사용

LFM2.5 · 2026-06-26

LFM2.5 230M 모델이 WebGPU 커널을 활용해 브라우저 내에서 1,400 토큰/초 속도로 실행돼요. Fable 5 팀이 개발한 커널과 Opus 4.8이 사용됐으며, M4 Max에서 테스트했어요.

LiquidAI의 LFM2.5-230M (GGUF) 모델을 사용하며, Hugging Face Spaces에서 데모를 확인할 수 있어요. 사용자 xenovatech이 Reddit에 관련 내용을 공유했어요.

##LLM##WebGPU##브라우저##LFM2.5
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기