연구진은 LLM이 훈련 데이터와 의미적 표면이 다른 OOD 입력에서 약점을 보이는 '단축키 학습' 문제를 해결하기 위해 IGA(Invariant Gradient Alignment) 프레임워크를 제안했어요.
IGA는 논리적 구조는 동일하지만 의미적 영역이 다른 문제 그룹(Logical Isomer Sets)을 활용하고, Continuous Gradient Conflict Mask를 통해 불필요한 파라미터 변화를 억제해요.
실험 결과, IGA는 기존 방법 대비 최대 14.3%의 정확도 향상과 4배 향상된 표현 불변성(Logical Consistency Score 0.031)을 달성했어요.