Pulse · AI 뉴스

LoKA: 대규모 추천 모델에 FP8 적용을 위한 저정밀 커널 활용

LoKA · 2026-05-12

LoKA는 FP8을 대규모 추천 모델(LRM)에 적용하기 위한 프레임워크로, 모델과 하드웨어의 공동 설계를 통해 성능을 향상시킵니다.

LoKA Probe는 층별 오류를 정량화하여 FP8 적용 가능 영역을 파악하고, LoKA Mods는 수치적 안정성과 실행 효율성을 개선합니다.

LoKA Dispatch는 LoKA Probe의 통계적 정보를 활용하여 가장 빠른 FP8 커널을 선택하여 정확도 요구 사항을 충족합니다.

##추천시스템##FP8##저정밀
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기