Pulse · AI 뉴스

RTLC: LLM 판별 능력 향상을 위한 3단계 프롬프트 기법, JudgeBench에서 성능 향상

Claude 3.7 Sonnet · 2026-05-14

연구진은 LLM 판별 능력 향상을 위해 '연구-가르침-비판(RTLC)'이라는 3단계 프롬프트 기법을 제안했습니다. 이 기법은 페인만 학습 기법을 활용하여 LLM이 스스로 생각하는 과정을 모방하도록 설계되었습니다. JudgeBench-GPT 테스트에서 Claude 3.7 Sonnet의 정확도는 기존 방식 대비 14.0% 향상된 78.6%를 기록했습니다.

RTLC는 3단계로 구성되며, 각 단계는 '연구', '가르침', '비판'을 수행합니다. '가르침' 단계는 전체 성능 향상에 가장 큰 영향을 미치며, '비판' 단계는 추가적인 성능 향상을 가져옵니다. RTLC는 기존 방식보다 비용 효율적이며, 다양한 JudgeBench 카테고리에서 오류 예방에 기여합니다.

##LLM##프롬프트##JudgeBench##Claude##연구

매일 핵심 AI 소식을 한국어로, 빠르게

App Store 에서 Pulse 받기 앱에서 열기