LAUKIN은 호주, 영국, 인도 간 계약 조항의 법률적 동등성을 평가하는 데이터셋입니다. 다국적 기업의 교차 관할 계약 검토를 지원하기 위해 개발되었으며, 총 14,727개의 조항 쌍으로 구성되어 있습니다. 법률 전문가가 3,000개의 조항 쌍을 직접 검토했으며, 65.11%의 최고 매크로 F1 점수를 기록했습니다.
데이터셋은 8가지 계약 유형의 204개 계약에서 추출되었으며, 조항 쌍 매핑을 위한 파이프라인을 활용하여 초기 매핑을 수행했습니다. LAUKIN은 법률 NLP 연구를 위한 도전적인 벤치마크로 자리매김했습니다.