프롬프트 엔지니어링은 대규모 언어 모델(LLM)의 성능을 이끌어내는 데 핵심적인 역할을 합니다. 이 과정에서 프롬프트 선택은 가장 효과적인 프롬프트를 효율적으로 찾는 중요한 단계입니다. 하지만 기존 연구는 프롬프트 성능의 다면적인 특성을 단일 지표로 포괄할 수 없다는 중요한 과제를 간과했습니다.
본 연구는 파레토 프롬프트 집합 복구와 최적의 실현 가능한 프롬프트 식별이라는 두 가지 실제 환경에서 다중 목적 프롬프트 선택 문제를 연구합니다. 문제를 순수 탐험 밴딧 프레임워크로 재구성하여 다중 목적 밴딧에서 검증된 효율적인 알고리즘을 적용하고, 구조화된 밴딧에서 최적의 실현 가능한 팔 식별을 위한 새로운 설계를 도입했습니다.
다양한 LLM에 대한 광범위한 실험 결과, 밴딧 기반 접근 방식이 기존 방식에 비해 상당한 성능 향상을 보여주며, 다중 목적 프롬프트 최적화를 위한 원칙적이고 효율적인 프레임워크를 확립했습니다.