구글이 스마트폰과 엣지 기기에서 '젬마 4'를 원활하게 구동할 수 있도록 최적화한 QAT 버전을 공개했어요. 모바일 전용 양자화 기술로 모델 크기를 1GB 수준으로 줄였어요. QAT 버전을 통해 고성능 생성 AI의 온디바이스 실행 시대를 앞당길 수 있을 것으로 기대돼요. 구글은 5일 젬마 4 QAT 체크포인트를 공개했어요.