Pulse · AI 뉴스

언어 디퓨전 모델, 미지의 데이터 검색이 가능한 연상 기억

UDDMs · 2026-04-30

언어 디퓨전 모델이 훈련 데이터를 언제 암기하고, 진정한 생성 단계를 어떻게 정량적으로 평가할 수 있는지 연구했어요.

연구 결과, Uniform-based Discrete Diffusion Models (UDDMs)는 연상 기억처럼 작동하며, 창의적인 능력도 갖추고 있어요.

훈련 데이터셋 크기에 따라 훈련 데이터 암기에서 일반화로의 전환이 일어나며, 조건부 엔트로피를 통해 이 전환을 감지할 수 있어요.

##언어모델##디퓨전모델##기억##메모리##엔트로피
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기