스탠포드 비전랩이 연구용·상업적 사용 모두 허용하는 GPIC 데이터셋을 공개했어요. GPIC는 약 28조 픽셀 규모로, 100만 개의 테스트 예제를 포함하고 있어요. 데이터셋은 Hugging Face에서 중앙 호스팅되며, 벤치마크 프로토콜과 모델도 함께 제공돼요.
GPIC는 최첨단 vision-language 모델로 캡셔닝된 다양한 인터넷 이미지를 포함하고 있으며, 안전 필터링 및 중복 제거 과정을 거쳤어요. 연구 및 상업적 용도로 자유롭게 사용할 수 있으며, 관련 벤치마크 프로토콜과 모델은 GitHub에서 확인할 수 있어요.