BeeLlama 팀이 v0.2.0 버전을 공개하며 Qwen 3.6 및 Gemma 4에 대한 효율적인 DFlash 구현을 제공합니다. RTX 3090 환경에서 Qwen 3.6 27B 모델의 처리 속도가 최대 4.4배, Gemma 4 31B 모델은 4.93배 향상된 성능을 보여줍니다. 이번 업데이트는 DFlash 오버헤드 감소, K/V 캐싱 최적화, CUDA 실행 안정성 개선 등을 통해 프롬프트 처리 속도를 기존 수준에 가깝게 만들었습니다.