Pulse · AI 뉴스

투표할 때, 다시 쓸 때: 의견 불일치 기반 전략 라우팅을 통한 테스트 시간 확장

arXiv cs.AI · 2026-04-29

대규모 추론 모델(LRM)은 수학적 추론 작업에서 강력한 성능을 보이지만 어려운 경우 신뢰성이 떨어져요.

연구진은 출력 불일치가 난이도와 예측 정확도와 강하게 상관관계가 있다는 점에 주목해 테스트 시간 확장 전략을 선택하는 데 활용했어요.

새로운 프레임워크는 불일치 정도에 따라 간단한 해결, 다수결 투표, 재작성 기반 재구성 전략을 동적으로 선택하며, 기존 방식보다 정확도를 높이고 샘플링 비용을 줄여요.

##추론##모델##전략##라우팅##성능

매일 핵심 AI 소식을 한국어로, 빠르게