연구진은 텍스트 임베딩이 인간 전문가의 의미론적 거리를 정확히 반영하는지 확인하기 위해 Stakeholder Grounding Exercise라는 방법론을 제시했어요.
덴마크 정책 이슈 사례 연구에서 신경망 텍스트 임베딩은 인간 전문가보다 신뢰도가 낮고, 이는 클러스터링 성능 저하로 이어지는 것으로 나타났어요 (19~26 pp).
미국 연방 AI 사용 사례 연구에서도 유사한 격차(16 pp)가 확인되어, 이 방법론이 특정 도메인이나 환경에 국한되지 않음을 보여줬어요.