자연어 처리(NLP)의 핵심 과제인 시퀀스 라벨링은 입력 문장의 각 토큰에 레이블을 할당하는 작업이에요. 기존 CRF 모델은 표현력 제한과 장거리 의존성 처리의 한계를 보여왔어요. 연구진은 노이즈가 섞인 레이블 시퀀스에 조건부 CRF를 학습하기 위해 확산 모델을 활용하는 방법을 제시했어요.
근사 CRF 추론과 함께 이 방법을 사용했을 때 POS 태깅 정확도가 향상되었으며, 오류율이 16.5% 감소했어요. 이 연구는 시퀀스 라벨링 모델의 성능 향상 가능성을 보여주는 중요한 결과예요.