연구진은 LLM 기반 코드 생성 시 발생하는 오류 위험에 대응하기 위해 코드 불확실성 추정(UE) 방법론을 제안했어요. 기존 자연어 처리(NL) 방식의 UE 방법은 코드의 특성을 제대로 반영하지 못한다는 문제점을 지적했어요.
코드의 세 가지 특징(토큰의 취약성, 의도와 코드의 불일치, 실행 가능성)을 고려하여 어휘, 알고리즘, 기능적 일관성을 나타내는 세 가지 불확실성 축을 정의하고, 이를 앙상블하여 기존 NL 기반 방법보다 성능을 8.1% 향상시켰어요.
Qwen3-14B 모델에서 단일 패스 토큰 엔트로피만으로도 기존 다중 패스 기반 방법과 비슷한 성능을 내면서 비용 효율성을 높이는 결과를 보여, 코드 UE는 NL 방식에서 벗어나야 함을 강조했어요.