문샷 AI가 Kimi Delta Attention 가속을 위한 FlashKDA 커널을 오픈소스로 공개하여, 트라이톤 기준 2.22배 빠른 성능을 보입니다. FlashKDA는 플래시 리니어 어텐션(FLA)의 백엔드 레이어로 통합되어 기존 FLA 사용자도 쉽게 적용할 수 있습니다. 현재 포워드 패스만 지원하며, H20 칩에서 측정된 결과이므로 H100 또는 Blackwell 칩에서의 성능은 달라질 수 있습니다.