사용자 생성 콘텐츠(UGC)에서 NER 모델의 성능 저하 문제를 해결하기 위해 정보 밀도(ID)라는 새로운 요인을 발견했어요.
연구팀은 Attention Spectrum Analysis(ASA)를 통해 ID 감소가 모델의 주의 집중 능력을 저하시켜 NER 성능을 떨어뜨린다는 사실을 밝혀냈어요.
Window-Aware Optimization Module(WOM)을 제안하여 UGC의 정보가 부족한 영역을 개선하고, 기존 모델 구조를 변경하지 않고도 성능을 향상시켰어요.