Pulse · AI 뉴스

PushupBench: VLMs는 아직 턱걸이 개수를 잘 세지 못합니다

PushupBench · 2026-04-26

연구진은 VLMs가 영상 속에서 무엇이 발생하는지 인식하지만, 몇 번 반복되는지 세는 데 어려움을 겪는다는 점을 지적했어요.

PushupBench 데이터셋을 공개하여 446개의 긴 영상 클립을 활용해 반복 횟수 세기 능력을 평가할 수 있도록 했어요.

연구 결과, 정확도가 오해를 불러일으킬 수 있으며, 약한 모델은 단순히 가장 흔한 개수를 활용하는 경향이 있는 것으로 나타났어요.

##VLMs##벤치마크##영상분석##PushupBench##계산
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기