Wu et al. 연구에서 MLE 목표는 데이터셋의 높은 이미지 수로 인해 계산적으로 실현 불가능합니다. NCE(Noise-Contrastive Estimation)를 사용하여 복잡한 손실을 근사화합니다. 하지만 결국 분모를 추정하게 됩니다. Claude는 이 방식이 편향된 추정량이라고 설명했지만, 그 이유를 명확히 이해하지 못했습니다.