Pulse · AI 뉴스

IIE 모델 성능 평가 벤치마크 I2EBench2.0 공개

I2EBench2.0 · 2026-06-14

연구진이 단일 라운드 및 다중 라운드 이미지 편집 모델 성능 평가를 위한 벤치마크 I2EBench2.0을 공개했어요.

I2EBench2.0은 16가지 단일 라운드 평가 기준과 7가지 다중 라운드 평가 기준을 포함하며, 인간 평가와 일치하도록 사용자 조사를 거쳤어요.

GitHub에서 관련 코드, 데이터셋, IIE 모델이 생성한 이미지들을 확인할 수 있어요.

I2EBench2.0 분석 결과, 현재 IIE 모델의 강점과 약점을 파악하고 향후 연구 방향을 제시했어요.

##IIE##이미지편집##벤치마크##I2EBench2.0
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기