Pulse · AI 뉴스

언어 모델 출력 분포 샘플링 시 발생하는 오차의 기하학적 관계

arXiv cs.LG · 2026-05-06

GPT 스타일 언어 모델은 예측된 확률 분포가 여러 토큰에 걸쳐 분산된 생성 지점에서 단일 토큰 변경에 민감하게 반응합니다.

본 연구에서는 토큰 임베딩의 기하학적 구조에만 의존하는 $\mathfrak{so}(n)$-값 1-형식을 도출하여 이러한 민감성을 기하학적 속성으로 파악합니다.

체스 추론 작업에서 이 곡률은 오프더셸프 지시 튜닝 모델의 세계 모델과 결합되며, 보드 영역 및 기물 중요도를 존중하여 변환이 클러스터링됩니다.

##언어모델##기하학##체스##세계모델
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기