Pulse · AI 뉴스

전문가 모델 곱셈 훈련, 자연어 추론에서 데이터셋 아티팩트 감소

arXiv cs.CL · 2026-04-21

자연어 추론 모델은 데이터셋 아티팩트에 과적합되는 경향이 있어요.

Product-of-Experts (PoE) 훈련은 편향된 모델이 과신하는 예시의 가중치를 낮춰 아티팩트 의존성을 줄여요.

PoE 훈련은 정확도를 거의 유지하면서도 아티팩트 의존성을 4.71% 감소시켰어요.

##NLI##PoE##데이터편향
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기