연구자는 체스 경기 기록으로 학습된 50M 파라미터 트랜스포머 모델에 불가능한 수를 입력했을 때 모델의 반응을 실험하고자 합니다. 불가능한 수의 종류에 따라 모델의 실패 양상이 달라지는지 확인하여 모델이 학습한 내부 표현 방식에 대한 통찰력을 얻고자 합니다. 실험은 규칙 위반, 경로 위반, 불가능한 위협, 참조 모호성, 전략적 부조리 등 다양한 수준의 불가능한 수를 포함합니다.