연구진이 2000개 실험을 포함하는 대규모 사후 보정 벤치마크 'CalArena'를 공개했어요. 표준화된 벤치마크는 테이블 및 컴퓨터 비전 작업, 이진/다중 분류 등 다양한 설정에서 활용 가능해요. 연구 결과, 부드러운 보정 함수가 빈(binning) 방식보다 우수하고, 다중 분류 환경에서는 전용 방법이 필수적이라는 점을 확인했어요.