Google의 Diffusion Gemma 모델이 autoregressive 모델과 H100에서 벤치마크 결과, 속도는 4배 빠르지만 사실 오류는 6배 더 많았습니다.
DiffusionGemma는 Steve Jobs 전기, 테트리스 역사, BeOS 이야기 작성 테스트에서 33개의 사실을 맞혔지만 28개의 오류를 범했고, 특히 덜 인기 있는 주제에서 오류가 심각했습니다.
Google은 Diffusion Gemma가 품질이 낮다고 밝히며, 사실이 중요할 때는 일반 Gemma 4를 사용하라고 권고했습니다.