연구진이 은어와 표준어의 의미 변화를 감지하는 모델 벤치마킹을 위한 BD-LSC 데이터셋을 공개했어요. BD-LSC 데이터셋은 의미 획득, 상실, 안정성을 포괄하며, ST-WSD 데이터셋은 은어와 표준어의 미세한 의미 차이를 담고 있어요. GPT-4o 모델이 가장 높은 성능을 보였지만, 은어의 희귀한 의미를 정확히 파악하는 데 어려움이 남아있다고 분석됐어요.