Pulse · AI 뉴스

BeeLlama v0.2.0: Qwen 3.6 및 Gemma 4 지원 강화, RTX 3090 성능 대폭 향상

BeeLlama · 2026-05-23

BeeLlama 팀이 v0.2.0 버전을 공개하며 Qwen 3.6 및 Gemma 4에 대한 효율적인 DFlash 구현을 제공합니다.

RTX 3090 환경에서 Qwen 3.6 27B 모델의 처리 속도가 최대 4.4배, Gemma 4 31B 모델은 4.93배 향상된 성능을 보여줍니다.

이번 업데이트는 DFlash 오버헤드 감소, K/V 캐싱 최적화, CUDA 실행 안정성 개선 등을 통해 프롬프트 처리 속도를 기존 수준에 가깝게 만들었습니다.

##BeeLlama##Qwen##Gemma##DFlash##RTX3090

매일 핵심 AI 소식을 한국어로, 빠르게