본 논문은 다양한 데이터 제약 조건과 감독 수준에서 Entity Matching (EM) 시스템의 성능을 평가합니다. 특히 저자원, 도메인 인지 EM 방법인 BEACON의 성능에 미치는 알고리즘 선택과 데이터 가용성 조건의 영향을 분석합니다. 실험을 통해 분산 정렬의 역할과 BEACON 프레임워크의 동작 방식을 심층적으로 파악합니다.
BEACON은 도메인 정보를 활용하여 Entity Matching (EM) 시스템의 정확도를 높이는 방법입니다. 본 논문은 BEACON의 다양한 변형을 실험하며, 데이터 가용성 조건에 따른 성능 변화를 분석합니다.
연구 결과는 저예산 환경에서 도메인 정보를 활용한 Entity Matching 시스템을 구축하는 데 필요한 알고리즘 선택 기준과 데이터 가용성 조건을 제시합니다.