Pulse · AI 뉴스

STRIDE: 학습 데이터 기여도 추적 기술, LLM 사전 훈련에서 최고 성능 달성

STRIDE · 2026-06-04

STRIDE는 LLM의 예측을 학습 데이터에 연결하는 기술로, 기존 방식의 한계를 극복하기 위해 활성화 공간에서 작동합니다.

STRIDE는 학습 데이터 부분집합에 따른 행동 변화를 모방하는 '조향 연산자'를 학습하여 테스트 예측을 섭동하고, 개별 학습 예제 영향도를 복구합니다.

기존 방식보다 13배 빠른 속도로 LLM 사전 훈련 기여도 추적에서 최고 성능을 달성했으며, 데이터 선택, 오염, 질적 분석 등 다양한 분야에서 활용 가능성을 입증했습니다.

##LLM##TDA##기여도추적##활성화공간##컴프레시브센싱
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기