연구진이 현실 세계 적용에 어려움을 겪는 혼합 객체 환경에서 객체 세기 모델의 성능 격차를 해소하기 위해 MixCount 데이터셋과 벤치마크를 공개했어요.
자동 생성 파이프라인을 통해 이미지, 텍스트 설명, 픽셀 단위 객체 개수 정보를 대량으로 생성하여 기존 데이터셋의 한계를 극복했어요.
MixCount 데이터셋으로 기존 모델을 평가한 결과 성능 저하가 확인되었지만, MixCount 데이터로 학습시키니 실제 벤치마크에서 MAE가 각각 20.14%·18.3% 감소했어요.