연구진은 지속적으로 변화하는 실제 환경에 맞춰 새로운 개념을 학습하는 개방형 어휘 객체 감지(OVD) 모델의 한계를 극복하기 위해 COVD(Continual OVD with Novel Concept Injection)라는 새로운 task setting과 benchmark인 Novel-114를 제안했어요.
COVD는 기존 모델이 이미 인지하고 있는 새로운 개념을 활용하고, 시각적 표현과 텍스트 개념 간의 안정적인 의미 정렬 부족 문제를 해결하는 데 집중해요.
NoIn-Det 프레임워크는 추가 파라미터 없이 시각적 인코더를 고정하고, 텍스트 표현 공간을 보존하며, 소수의 텍스트 브랜치 파라미터만 업데이트하여 새로운 개념을 주입하는 방식으로 기존 continual learning 방법보다 뛰어난 성능을 보여요.