연구진이 LLM의 추론 과정을 투명하게 보여주는 인과 그래프 구축 방법을 제시했어요. 이 방법은 LLM이 개념을 인식하고 예측을 내리는 과정을 시각화하여 이해를 돕습니다. 4단계로 구성된 방법론은 LLM이 인식하는 핵심 개념을 찾아내고, 입력 데이터를 개념 상태로 매핑합니다.
MCMC 기반의 반사실적 증강 절차를 통해 데이터셋을 확장하고, 이를 바탕으로 안정적인 인과 그래프를 생성하여 LLM의 추론 과정을 설명합니다. 질병 진단, 감정 분석, LLM 심판 등 다양한 작업에 적용하여 유의미한 의존성을 발견했습니다.