Pulse · AI 뉴스

구글 딥마인드, 멀티모달 AI '젬마 4' 공개: 온디바이스 활용 가능성 제시

Hugging Face · 2026-04-02

구글 딥마인드가 이미지, 텍스트, 오디오 입력을 지원하는 멀티모달 AI 모델 '젬마 4'를 허깅페이스에 공개했습니다. 젬마 4는 아파치 2.0 라이선스로 공개되어 누구나 자유롭게 사용할 수 있습니다.

젬마 4는 이전 모델보다 개선된 이미지 인코더를 탑재했으며, 다양한 크기(2.3B, 4.5B, 31B, 26B)로 제공되어 온디바이스 활용도 가능성을 높였습니다. 특히 26B 모델은 4B 파라미터만 활성화된 상태에서도 뛰어난 성능을 보입니다.

젬마 4는 트랜스포머, 라마.cpp, MLX, Rust 등 다양한 환경에서 활용 가능하며, Per-Layer Embeddings (PLE)와 Shared KV Cache 등 효율적인 아키텍처를 채택하여 장문 컨텍스트 처리 및 에이전트 활용에 적합합니다.

##AI모델##멀티모달##구글딥마인드
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기