개발자가 이미지 데이터셋 관리 툴 'Cull'을 오픈소스 공개했으며, Civitai, X/Twitter, Reddit, Discord 등 다양한 플랫폼에서 이미지를 스크래핑하고 자동 분류하는 기능을 제공합니다.
Cull은 이미지와 소스 프롬프트를 로컬 큐에 저장하고, 비전-언어 모델을 활용하여 17개 필드 JSON 스키마로 이미지를 분류하며, 사용자가 품질과 주제 관련성을 조정할 수 있습니다.
Flask + Alpine 기반 대시보드를 통해 스크래핑 시작/중지, 이미지 분류, ZIP 내보내기 등 다양한 기능을 제공하며, Claude Code 스킬 번들 및 에이전트 지원을 통해 AI 어시스턴트 활용도를 높입니다.
향후 더 많은 비전 워커 백엔드, 개선된 재큐 기능, CLI, 비디오 스크래핑 기능 등이 추가될 예정이며, Python 3.10+, Flask, Alpine.js, Pillow, Playwright, gallery-dl 스택으로 구성되어 MIT 라이선스 하에 배포됩니다.