Pulse · AI 뉴스

LLM 평가자 주도적 선호도 역학 분석 프레임워크 및 다중 평가자 감사

OpenAI · 2026-06-29

연구진은 독점 LLM 평가자의 측정값이 몇 주 안에 무효화될 수 있음을 확인하고, 이를 진단할 수 있는 프레임워크를 제시했습니다.

EPC(Multimodal Preference Collapse Index, 평가자 결합 행렬, Jensen-Shannon divergence)를 활용하여 8가지 실험 조건에서 평가자 간의 결합 계수를 분석했습니다.

GPT-4o May, Qwen3.7-plus, DashScope 30r 등 4가지 조건에서는 강한 결합이 나타났지만, GPT-4o June, qwen-plus 등에서는 거의 0에 가까운 붕괴가 관찰되었습니다.

##LLM##평가##연구##GPT-4o##Qwen
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기