본 논문에서는 공동 개체 및 관계 추출 모델의 일반화 성능을 향상하기 위한 새로운 데이터 증강 방법인 SSDAU(Structured Semantic Data Augmentation)를 제안합니다.
SSDAU는 텍스트의 의미 구조를 보존하면서 개체 레이블 기반으로 텍스트를 분할하고, 문맥 인지 방식으로 개체의 의미적 특징을 캡처하여 증강 데이터를 생성합니다.
실험 결과, SSDAU는 기존 방법 대비 의미적으로 일관된 데이터를 생성하며, 모호함에 대한 강건성도 뛰어나 모든 지표에서 우수한 성능을 보였습니다 (기존 방법 대비 F1 점수 8.26% 감소 vs. 31.91%).