연구 결과, LLM의 지정학적 편향은 사전 훈련 데이터가 아닌, 튜닝 과정에서 발생하는 것으로 나타났습니다. 7개 AI 연구실의 모델을 분석한 결과, 6곳에서 모델 개발 지역과 관련된 편향이 나타났습니다.
알리바바의 Qwen 2.5 모델은 중국에 대한 호감도가 18배나 크게 증가하는 등, 튜닝 과정에서 편향이 크게 변화하는 것을 확인했습니다.
프롬프트 언어에 따라 편향이 달라지는 현상도 관찰됐는데, 프랑스 모델인 미스트랄은 프랑스어 프롬프트에서만 프랑스에 대한 긍정적 편향을 보였습니다.