Pulse · AI 뉴스

CORE: 대비적 반성으로 빠른 추론 능력 향상

CORE · 2026-05-28

연구진은 언어 모델이 검증 가능한 보상을 활용해 다양한 추론 과제에서 성능을 향상시키는 CORE(Contrastive Reflection)라는 새로운 알고리즘을 개발했어요.

CORE는 성공적/실패한 추론 과정을 비교하여 전략과 제약 조건을 담은 자연어 설명을 생성하며, 기존 방법 대비 적은 샘플과 모델 실행으로도 빠른 성능 향상을 가능하게 해요.

연구 결과, CORE는 5개 샘플만으로도 기존 방법과 유사하거나 더 큰 성능 향상을 달성했으며, 지식 저장 시 더 적은 토큰을 사용해 효율성을 높였어요.

##추론##자기개선##CORE##자연어

매일 핵심 AI 소식을 한국어로, 빠르게