연구진이 단일 라운드 및 다중 라운드 이미지 편집 모델 성능 평가를 위한 벤치마크 I2EBench2.0을 공개했어요.
I2EBench2.0은 16가지 단일 라운드 평가 기준과 7가지 다중 라운드 평가 기준을 포함하며, 인간 평가와 일치하도록 사용자 조사를 거쳤어요.
GitHub에서 관련 코드, 데이터셋, IIE 모델이 생성한 이미지들을 확인할 수 있어요.
I2EBench2.0 분석 결과, 현재 IIE 모델의 강점과 약점을 파악하고 향후 연구 방향을 제시했어요.