연구진은 비전-언어 모델(VLM)의 분류 정확도를 높이기 위해 Text Prompt Boosting(TPB) 프레임워크를 제안했어요. TPB는 AdaBoost 방식을 활용해 오분류된 예시를 집중적으로 개선하는 텍스트 프롬프트를 생성해요.
TPB는 모델에 구애받지 않고 재사용 가능한 텍스트 프롬프트를 생성하며, 다양한 VLM에서 성능 향상을 이끌어내요.
11개의 벤치마크 테스트에서 TPB는 기존 방법보다 정확도를 높이고, 더 큰 VLM으로 성능을 전가하는 데 성공했어요.