Pulse · AI 뉴스

사람 피드백 기반 강화 학습으로 요약 능력 향상

OpenAI · 2020-09-04

사람 피드백 기반 강화 학습을 활용하여 요약 능력이 향상된 언어 모델을 학습했어요.

기존 방식보다 사람이 선호하는 요약 결과물을 더 잘 생성하도록 훈련했어요.

이 기술은 언어 모델의 성능을 개선하는 데 기여할 수 있을 거예요.

##강화학습##요약##OpenAI

매일 핵심 AI 소식을 한국어로, 빠르게