본 연구는 단일 작업 훈련/추론을 넘어 일반화하는 세 가지 방법을 탐구합니다. QLoRA PEFT 기법을 사용하여 감정, 주제, 다중 속성 제어를 위한 세 가지 데이터셋을 테스트했습니다. PEFT 모듈 출력 합성이 특히 강력한 합성 방법으로, 단일 작업 전문 모듈과 비교해도 성능이 우수합니다.
다중 모듈 출력 합성은 감정 제어에서 평균 2% 성능 향상을 달성했습니다. 이는 여러 관련 데이터셋을 결합하여 훈련하거나, 추론 시 개별적으로 훈련된 PEFT 모듈의 가중치 행렬을 합성하는 것보다 뛰어난 결과입니다.
본 연구는 PEFT 모듈 출력 합성이 다양한 LLM에서 속성 제어 텍스트 생성 성능을 향상시키는 효과적인 방법임을 보여줍니다.