Pulse · AI 뉴스

EgoProactive 데이터셋 공개: 절차적 작업 지원 벤치마크 및 아키텍처

Llama · 2026-06-03

연구진이 절차적 작업 지원을 위한 대규모 데이터셋 EgoProactive를 공개했어요. EgoProactive는 사용자의 계획 이탈 상황(OOP)과 복구 과정을 명시적으로 포함하고 있어요.

Ego4D, EPIC-KITCHENS 등 5개 벤치마크를 통합한 Pro extsuperscript{2}Bench를 새롭게 구성했어요. 이를 통해 다양한 절차적 작업 환경에서 모델 성능을 평가할 수 있게 됐어요.

계획 수립과 상호작용을 분리하는 새로운 아키텍처를 제안하고, Llama 4와 Qwen-3.6-VL 모델에서 성능을 검증했어요.

실험 결과, EgoProactive로 학습한 Llama 4 모델이 Claude Opus 4.6, Gemini 3.1 Pro, GPT 5.2 등 기존 모델보다 객관적인 개입 품질이 높게 평가됐어요.

##데이터셋##벤치마크##Llama4##Qwen
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기