Pulse · AI 뉴스

LLM 학습 데이터 기여도 분석: 양방향 그래디언트 최적화 기법

arXiv cs.CL · 2026-06-03

연구진이 LLM의 출력에 영향을 준 학습 데이터를 분석하는 새로운 기법을 개발했어요. 이 기법은 양방향 그래디언트 최적화를 활용하여 모델의 손실 변화를 측정하고, 데이터 기여도를 파악해요.

학습 데이터 기여도 분석(TDA)은 생성된 텍스트 샘플에 대한 양방향 그래디언트 최적화(gradient ascent and descent)를 통해 모델을 교란하고, 학습 데이터의 손실 변화를 측정하는 방식으로 구현돼요. 이 방법은 사실 및 스타일 기여도 분석을 모두 지원하며, 다양한 데이터 수준에서 적용 가능해요.

연구 결과, 개발된 기법은 알려진 학습 데이터셋을 사용한 사전 훈련 모델에서 기존 영향력 측정 방법보다 우수한 성능을 보였으며, 이는 책임감 있는 AI 시스템의 필수 요소인 모델 해석력을 향상시키는 데 기여할 것으로 평가돼요.

##LLM##데이터기여도##인터프리터빌리티##AI
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기