Gemma 4 WebGPU 커널이 토큰당 255 처리 속도를 달성하며 주목받고 있어요. 이는 100개 이상의 토큰/초 처리 속도를 의미하며, Claude나 Codex 같은 모델에 비해 로컬 모델의 활용도를 높일 수 있습니다. x/@xenovacom 계정에서 관련 정보를 공유했어요.
로컬 모델이 대부분의 작업을 처리하고, 고도의 지능 작업에는 최첨단 모델을 활용하는 방식으로 AI 활용 전략을 개선할 수 있습니다. WebGPU 커널은 Gemma 4 모델의 성능을 향상시키는 데 기여할 것으로 보입니다.