Pulse · AI 뉴스

대규모 언어 모델의 기본 능력 분해: 다중 작업 지시 튜닝에서의 교차 작업 간섭 완화

arXiv cs.CL · 2026-05-07

본 연구는 다중 작업 지시 튜닝에서 발생하는 교차 작업 간섭 문제를 해결하기 위해 새로운 방법인 BADIT(Basic Abilities Decomposition for multi-task Instruct-Tuning)을 제안합니다.

연구 결과, 기존 방법으로는 교차 작업 간섭을 완전히 해결하기 어렵다는 것을 밝혀냈으며, LLM이 여러 직교하는 기본 능력을 인코딩한다는 점에 착안하여 BADIT를 개발했습니다.

SuperNI 벤치마크에서 6개의 LLM을 대상으로 실험한 결과, BADIT는 기존 최고 성능 모델보다 우수한 성능을 보이며 교차 작업 간섭을 완화하는 데 효과적임을 입증했습니다.

##LLM##연구##LoRA

매일 핵심 AI 소식을 한국어로, 빠르게