연구진은 특정 데이터셋에 대한 지도 학습(SFT) 모델이 헤더-연산 단축키에 의존하는 문제를 해결하기 위해 TaNOS라는 새로운 지속적 사전 훈련 프레임워크를 개발했어요.
TaNOS는 헤더 익명화, 연산 스케치, 그리고 프로그램-질문 쌍을 생성하는 자기 지도 학습을 통해 수치 추론의 일반화 성능을 향상시키도록 설계되었어요.
TaNOS는 FinQA 데이터셋에서 80.13%의 실행 정확도를 달성하며, GPT-5, Gemini-2.5-Pro와 같은 모델보다 뛰어난 성능을 보여주었으며, 도메인 변화에 대한 강건성도 향상되었어요.