ZEBRA는 오디오-언어 모델의 기반 클래스 학습과 새로운 클래스 일반화 성능 간 격차를 줄이는 프레임워크입니다. 프롬프트 학습 로그릿과 제로샷 로그릿을 결합하고 자체 엔트로피 정규화를 사용하여 기반 클래스에 대한 과적합을 줄입니다. 실험 결과, ZEBRA는 기반 정확도를 유지하면서 새로운 클래스 성능을 향상시킵니다.
기존 프롬프트 학습은 새로운 클래스 성능을 저하시키는 문제를 겪는데, ZEBRA는 이를 개선하여 기반-새로운 격차를 크게 줄입니다. 코드 GitHub에서 확인 가능합니다.
ZEBRA는 플러그 앤 플레이 방식으로 적용 가능하며, 다양한 오디오 분류 데이터셋에서 성능 향상을 보였습니다.