Pulse · AI 뉴스

Rust 기반 LFM2.5-8B-A1B 모델 CPU 구현체 공개

LFM2.5 · 2026-06-09

Rust 네이티브 CPU 기반 LFM2.5-8B-A1B 모델 구현체가 공개됐어요. 툴 사용 콜백, 테스트 추가, cargo 크레이트로 배포됐어요. 현재 prefill 속도 향상 작업 중이에요.

Ryzen 7950x 환경에서 디코딩 속도는 약 37 tokens/s로 거의 동일하지만, prefill 속도는 최적화되지 않았어요.

16GB RAM으로도 충분히 실행 가능하며, 약 7GB의 메모리 사용량으로 여러 Agent 인스턴스에서 재사용 가능해요.

##LFM2.5##Rust##CPU##모델구현
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기