Pulse · AI 뉴스

CAST: 다중 모드 코어셋 선택을 위한 붕괴 인식 다중 스케일 토폴로지 융합

CAST · 2026-05-12

CAST는 대규모 다중 모드 모델 훈련에 필요한 막대한 계산 비용을 줄이기 위해 데이터셋 선택을 활용하는 새로운 프레임워크입니다.

기존 방식의 한계를 극복하기 위해 이미지와 텍스트 모달리티 토폴로지를 융합하고, 다중 스케일 분포 매칭 기준을 도입했습니다.

Flickr30K 및 MS-COCO 데이터셋 실험 결과, CAST는 기존 데이터셋 선택 방식보다 우수한 성능을 보였습니다.

##데이터셋선택##다중모드##토폴로지융합
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기