Strands Evals는 이미지-텍스트 작업 평가를 위한 새로운 도구입니다. 텍스트만으로는 이미지 기반 답변의 정확성을 판단하기 어렵다는 문제점을 해결해요. MLLM (Multimodal Large Language Model)을 활용하여 이미지와 텍스트를 함께 분석하고, 답변의 근거 여부를 평가합니다. 시각 쇼핑, 문서 이해, 차트 분석 등 다양한 분야에서 모델 성능 검증에 활용될 수 있습니다.