연구팀은 시각적 프롬프트에 따라 영역 수준의 인지 능력을 향상시키는 CSteer라는 새로운 접근 방식을 개발했어요. CSteer는 훈련 없이 일반적인 대규모 멀티모달 모델(LMM)을 안내하여 여러 영역을 문맥적으로 참조하도록 합니다. 실험 결과, CSteer를 적용한 일반 LMM은 대부분의 경우 맞춤형 참조 LMM보다 뛰어난 성능을 보였어요.