Dataset Builder는 AI 모델 훈련 또는 이미지 선택을 위한 툴로, 영화나 러시 영상에서 프레임을 추출하고 품질을 필터링하여 데이터셋을 생성합니다. 자동으로 장면 전환을 감지하고, CLIP을 활용하여 의미론적 관련성을 분류하며, JoyCaption으로 각 프레임에 대한 설명 캡션을 생성합니다. 로컬 환경에서 실행되며, 클라우드나 유료 API 없이 이미지 파일과 텍스트 파일로 구성된 데이터셋을 제공합니다.