Pulse · AI 뉴스

CCTVBench: 다중 모달 LLM을 위한 대비 일관성 교통 영상 질의응답 벤치마크

CCTVBench · 2026-04-22

CCTVBench는 안전 관련 교통 사고 추론에 필요한 대비 일관성을 평가하기 위한 새로운 벤치마크입니다.

실제 사고 영상과 세계 모델로 생성된 가상 영상 쌍을 활용하여 모델의 판단 오류를 진단하고 개선합니다.

C-TCD라는 새로운 디코딩 방식을 통해 기존 모델의 성능을 향상시킬 수 있었습니다.

##벤치마크##교통##다중모달
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기