Pulse · AI 뉴스

10억 파라미터 모델, 지시 따르기 능력 오히려 퇴보… 원인 분석

r/LocalLLaMA · 2026-05-14

연구자가 10억, 20억, 30억 파라미터 규모의 모델을 instruction following (IF) 방식으로 학습시킨 결과, 10억 모델은 오히려 지시 따르기 능력이 감소하는 현상을 관찰했습니다.

30억 모델은 학습 후 IFEval 점수가 향상되었지만, 10억 모델은 -5.75, 20억 모델은 -4.91로 성능이 저하되었으며, 이는 학습 레시피나 학습률(LR)과 관련이 있을 가능성이 제기되었습니다.

연구자는 20억 모델을 재학습하여 원인 파악에 나설 예정이며, 유사한 현상을 경험한 사용자의 의견을 구하고 있습니다.

##모델출시##instructionfollowin##연구
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기