DiffusionGemma-26B 모델이 Gemma-4-26B 모델과 의료 시각 질의응답 데이터셋에서 동등하거나 뛰어난 성능을 보였어요. 이 모델은 기존 방식보다 3.5~4.4배 빠른 디코딩 속도를 자랑합니다. Discrete Diffusion 모델은 방사선사가 보고서 조각을 수정하고 모델이 그 사이의 텍스트를 채워 넣는 '드래프트' 기능을 제공해요.
기존 방식은 부적합한 방식으로 수정해야 하지만, Discrete Diffusion 모델은 양방향 디노이징을 통해 보고서 조각 수정 후 모델이 텍스트를 채워 넣는 기능을 지원합니다. 이는 실제 보고서의 간결성 및 불일치 문제를 해결하는 데 도움이 될 수 있어요.
3.8B 파라미터로 활성화된 이 모델은 최첨단 비전-언어 모델과 경쟁력을 갖추고 있으며, 의료 분야에서 Diffusion 모델의 가능성을 보여줍니다.