연구자들은 정치적 성향이나 교육 품질과 같은 관심 대상 결과에 따라 언어의 차이를 발견하는 것을 목표로 합니다. 기존 LLM 기반 가설 생성 방법은 전역적으로 차별적인 패턴을 선택하지만, 연구자의 전문 지식에 따른 데이터를 형성하는 변수를 고려하지 않습니다. 연구자들이 지정한 변수를 통합하여 관련 하위 그룹 내에서 차이를 발견하도록 안내하는 조건부 가설 생성 프레임워크를 소개합니다.
하위 그룹의 불균형과 차이 방향의 반전이라는 두 가지 문제가 발생합니다. 연구자들은 기능-변수 상호 작용을 도입하여 부호 반전을 감지하고, 하위 그룹 내에서 차이를 균등화하기 위해 하위 그룹 내에서 차이를 제거하고 역주파수 재가중치를 적용하는 두 가지 계량 경제학에 영감을 받은 방법을 제안합니다.
합성 실험에서 각 방법은 대상 설정에서 전역 기준을 능가하고, 두 개의 실제 데이터 세트에 대한 전문가 평가는 관련 하위 그룹 내에서 더 유용한 가설을 표면화합니다.