Pulse · AI 뉴스

AI 여행 에이전트가 투우를 예약할 수도: AI 모델의 잠재적 동물 복지 문제를 평가하는 새로운 벤치마크

TAC · 2026-06-17

연구진은 AI 에이전트가 사용자를 대신해 행동할 때 동물 복지 문제를 고려하는지 평가하는 새로운 벤치마크 TAC(Travel Agent Compassion)을 공개했어요.

TAC은 AI 에이전트에게 동물 착취가 관련된 여행 예약 시나리오를 제시하고, 모델이 회피하는지 측정하며, 현재 주요 모델들은 무작위 수준에도 미치지 못하는 성능을 보였어요.

단 한 문장의 복지 관련 프롬프트 추가만으로도 Claude Opus 4.7과 GPT-5.5의 성능이 크게 향상되었으며, 이는 텍스트 기반 복지 벤치마크의 한계를 시사해요.

##AI에이전트##동물복지##벤치마크##ClaudeOpus4.7##GPT-5.5
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기