연구진이 병렬 토큰 생성을 위한 새로운 디코딩 프레임워크를 발표했어요. 이 방법은 모델의 예측 분포에서 파생된 쌍별 상호작용을 사용하여 각 마스크 위치에 커밋 점수를 할당하고 이러한 점수를 개선합니다. 평균장 이완은 단일 순방향 패스 내에서 충돌하는 동시 커밋을 억제하는 간단한 고정점 업데이트를 제공합니다.
기존 방식의 독립적인 토큰 선택은 병렬성을 저해하지만, 이 프레임워크는 더 많은 토큰을 병렬로 커밋하면서도 생성 품질을 유지합니다. 이 방법은 추가 모델이나 재훈련 없이 기존 확산 디코딩 파이프라인에 통합될 수 있습니다.
추론 및 코드 생성 벤치마크 실험에서 품질-지연 시간 균형 개선을 보였습니다.