Pulse · AI 뉴스

대상 분포 설계 관점에서 본 지도 미세 조정의 통합적 시각

arXiv cs.CL · 2026-06-10

연구진은 지도 미세 조정(SFT)을 토큰 수준 대상 분포 설계 문제로 재해석했어요. 새로운 Q-target 프레임워크를 도입하여 관찰된 토큰에 대한 의존도와 대체 토큰에 대한 확률 질량 배분 방식을 분리했어요. Target-SFT 방법은 원하는 대상 분포에서 직접 학습 목표를 구성하여 10개의 추론 데이터셋-모델 설정에서 기존 방식보다 성능이 우수했어요.

전체적으로 SFT 학습을 위한 근본적인 설계 원리를 밝히고 SFT 목표 검색 공간을 확장했어요.

##SFT##미세조정##대상분포##연구
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기