Pulse · AI 뉴스

훌륭한 Instruction-Tuning 데이터란 무엇일까요? In-Context Learning 관점

arXiv cs.CL · 2026-04-28

Instruction-tuning 데이터셋에는 종종 상당한 중복과 저품질 샘플이 포함돼 효과적인 데이터 선택 방법이 필요해요.

연구진은 In-Context Learning 관점에서 각 후보 예제가 관련 있는 다른 예제의 instruction-following 난이도를 얼마나 잘 줄이는지 측정하는 wICI(weighted in-context influence) 기반의 데이터 선택 프레임워크를 제안했어요.

실험 결과, wICI 방법은 제한된 데이터 예산 하에서 기존 방법보다 성능이 뛰어나며, 샘플 난이도가 in-context 영향력과 음의 상관관계가 있음을 보여줬어요.

##instructiontuning##데이터선택##incontextlearning##LLM
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기