연구진은 LLM의 문화적 편향을 정렬하는 새로운 방법인 DISCA를 개발했습니다. 이 방법은 각 국가를 여러 페르소나 에이전트로 정의하고, 이들의 의견 불일치를 활용하여 모델의 판단을 교정합니다.
DISCA는 20개국, 7가지 오픈 웨이트 백본 모델에서 문화적 불일치를 최대 24%까지 줄였으며, 이는 기존 튜닝 방식의 대안이 될 수 있습니다.
이 방법은 모델 가중치를 변경하지 않고도 추론 시점에 문화적 선호도를 조정할 수 있어, 글로벌 도덕적 선호도의 다양성을 충족하는 데 도움이 됩니다.