연구진이 의미 있는 결측값을 구분하는 새로운 확산 기반 프레임워크 'Diff-Joint'를 제안했어요. 이 프레임워크는 표 형식 데이터와 결측값 마스크를 함께 모델링하여 어떤 결측값을 보존하고 어떤 결측값을 복구할지 판단합니다. 기존 방법은 결측값이 관측되지 않은 정규 값이라고 가정하지만, Diff-Joint는 데이터의 의미 있는 결측값을 정확히 식별합니다.
Diff-Joint는 조건부 샘플링과 불확실성 인지 집계를 반복적으로 사용하여 보존해야 할 결측값과 복구해야 할 결측값을 구분합니다. 실험 결과, 기존 방법과 비교하여 우수한 보존 정확도와 다운스트림 작업 성능을 보였습니다.
이 프레임워크는 합성 데이터와 실제 데이터셋 모두에서 의미 있는 결측값을 효과적으로 식별하며, 기존 방법보다 더 정확한 결측값 추론이 가능합니다.