연구진은 언어 모델이 변수명을 대체해도 동일한 인과 추론 질문에 다른 답을 내놓는 현상을 관찰했어요. 이 현상이 정보 손실 때문인지, 아니면 표현 불일치 때문인지 조사하기 위해 Vernier라는 도구를 개발했어요. 실험 결과, 변수명에 따른 답의 차이는 표현 불일치에서 비롯된 것으로 나타났어요.
Vernier는 변수명 변경에 따른 표현 불일치를 바로잡기 위해 원본과 대체 프롬프트에 대한 반사실적 증강 기법을 사용했어요. 이 기법은 중간 답변에 대한 합의를 강화하는 데 효과적이었으며, 모델 종류, 규모, 작업에 따라 성공 여부가 달라졌어요.