연구자는 이미지 스크래핑, 분류, 캡셔닝 파이프라인을 위한 오픈소스 툴 'Cull'을 공개했습니다.
Cull은 Civitai, X/Twitter, Reddit, Discord 등 다양한 소스에서 이미지를 스크래핑하고, 비전-언어 모델로 분류하며, JSON 스키마를 사용하여 분류 결과를 기록합니다.
LoRA 학습 데이터셋 준비, 프롬프트 없는 아카이브 관리 등 다양한 사용 사례에 활용 가능하며, GitHub 저장소를 통해 확인할 수 있습니다.
향후 더 많은 비전 모델 백엔드 지원, 재큐 기능 개선, CLI 추가 등의 로드맵을 가지고 있습니다.
Cull은 이미지 데이터셋 관리 작업을 효율적으로 만들어주는 유용한 도구입니다.