Pulse · AI 뉴스

문샷, Kimi Delta Attention 가속을 위한 FlashKDA 오픈소스 공개

Moonshot AI · 2026-04-22

문샷 AI가 Kimi Delta Attention 가속을 위한 FlashKDA 커널을 오픈소스로 공개하여, 트라이톤 기준 2.22배 빠른 성능을 보입니다.

FlashKDA는 플래시 리니어 어텐션(FLA)의 백엔드 레이어로 통합되어 기존 FLA 사용자도 쉽게 적용할 수 있습니다.

현재 포워드 패스만 지원하며, H20 칩에서 측정된 결과이므로 H100 또는 Blackwell 칩에서의 성능은 달라질 수 있습니다.

##모델출시##KDA##CUDA
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기