연구진은 데이터 부족 문제를 해결하기 위해 시맨틱 앵커 기반 다중 모드 정보 추출 데이터 증강 프레임워크 SAMA를 공개했어요. SAMA는 CME-MLLM과 앵커 기반 이미지 생성 메커니즘을 활용해 다양한 데이터 샘플을 생성하고, 이 과정에서 시맨틱 앵커를 유지하며 시각적 맥락을 다양화해요. MNER, MRE, MEE 벤치마크 데이터셋 실험 결과, SAMA는 기존 증강 기법보다 뛰어난 성능을 보이며 저자원 환경에서도 효과적임을 입증했어요.