Pulse · AI 뉴스

CopT: 연속 공간 기반 상호 연역적 사고를 통한 일반 및 에이전트 추론

CopT · 2026-05-20

연구진은 LLM의 추론 과정을 개선하기 위해 기존의 사고-답변 순서를 뒤집은 새로운 파이프라인 'CopT'를 제안했습니다.

CopT는 초안 답변을 먼저 생성한 후, 자체 답변을 기반으로 온-정책 사고를 통해 검토 및 수정하며, 연속적인 임베딩을 활용해 답변의 신뢰도를 평가합니다.

CopT는 수학, 코딩, 에이전트 추론 작업에서 최대 23%의 정확도 향상과 최대 57%의 토큰 사용량 감소를 달성했습니다.

##LLM##추론##CopT##온정책

매일 핵심 AI 소식을 한국어로, 빠르게