Pulse · AI 뉴스

VGB 기반 마스크 디퓨전 모델: 보상 만족 및 샘플 편집을 위한 효율적인 테스트 시간 스케일링

MDM · 2026-06-27

연구진은 구조적 제약 조건 만족 또는 다운스트림 보상 최적화를 위해 생성 모델의 추론 시간 스케일링을 개선하는 VGB 기반 마스크 디퓨전 모델(MDM-VGB)을 소개했어요.

MDM-VGB는 보상 기반 리마스킹을 통해 이론적으로 타당한 방식으로 샘플을 생성하며, Sudoku 및 QM9와 같은 벤치마크에서 강력한 성능을 보여줬어요.

연구 결과, MDM-VGB는 프로세스 검증기 노이즈에 강건하며, 인기 있는 테스트 시간 휴리스틱보다 훨씬 효율적인 복잡도를 달성했어요.

##디퓨전모델##보상최적화##샘플편집
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기