Pulse · AI 뉴스

이미지 데이터셋 관리 툴 'Cull' 오픈소스 공개

Cull · 2026-05-11

연구자는 이미지 스크래핑, 분류, 캡셔닝 파이프라인을 위한 오픈소스 툴 'Cull'을 공개했습니다.

Cull은 Civitai, X/Twitter, Reddit, Discord 등 다양한 소스에서 이미지를 스크래핑하고, 비전-언어 모델로 분류하며, JSON 스키마를 사용하여 분류 결과를 기록합니다.

LoRA 학습 데이터셋 준비, 프롬프트 없는 아카이브 관리 등 다양한 사용 사례에 활용 가능하며, GitHub 저장소를 통해 확인할 수 있습니다.

향후 더 많은 비전 모델 백엔드 지원, 재큐 기능 개선, CLI 추가 등의 로드맵을 가지고 있습니다.

Cull은 이미지 데이터셋 관리 작업을 효율적으로 만들어주는 유용한 도구입니다.

##오픈소스##이미지##데이터셋##AI##스크래핑

매일 핵심 AI 소식을 한국어로, 빠르게