Pulse · AI 뉴스

언어 모델은 상태 변화를 추적할까? 엔티티 추적 메커니즘 분석

arXiv cs.CL · 2026-05-29

연구진은 복잡한 시나리오에서 자연어 기반 엔티티 추적(ET) 능력을 가진 대규모 언어 모델(LLM)의 작동 방식을 조사했어요.

LLM은 토큰별로 상태를 점진적으로 추적하거나 레이어별로 관련 상태를 기억하는 대신, 쿼리가 명확해지는 마지막 토큰에서 관련 정보를 병렬로 종합하는 방식으로 ET 문제를 해결해요.

연구 결과, LLM은 `REMOVE` 연산을 수행할 때 취약한 전역 억제 태그를 사용하며, 이로 인해 다양한 오류가 발생하고, 이를 부분적으로 해결하기 위해 태그를 무효화하는 방법을 제시했어요.

##언어모델##엔티티추적##기계학습

매일 핵심 AI 소식을 한국어로, 빠르게