Pulse · AI 뉴스

법의 영상 검색에서 모달리티 격차 해소

arXiv cs.CV · 2026-06-11

연구진이 법의 영상 검색을 위한 통합 프레임워크를 제시했어요. 4가지 주요 법의 과제(문신 검색, 전문가 설명 기반 검색, 손 그림 스케치 검색, 법의 얼굴 스케치 검색)에 적용 가능합니다.

MLLM을 활용해 모든 쿼리와 갤러리 이미지에 대한 구조화된 텍스트 설명을 자동 생성하고, 문장 변환기를 이용해 텍스트 기반 비교를 수행해요.

텍스트와 이미지를 융합한 방식이 시각 정보가 제한적이거나 노이즈가 많은 경우 검색 정확도와 안정성을 향상시키며, 법의 현장 조사에 유용한 도구임을 입증했어요.

##법의##영상검색##MLLM##모달리티
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기