Pulse · AI 뉴스

LongAttnComp: 장문 컨텍스트 추론을 위한 패밀리 간 컨텍스트 압축

LongAttnComp · 2026-05-31

연구진이 장문 컨텍스트 추론 성능을 높이는 LongAttnComp을 개발했어요. AttnComp을 기반으로 가벼운 크로스 어텐션 레이어를 조정하고 토큰 단위 청킹, 토큰 예산 top-p 알고리즘, 위치 재정렬, 형식 불문 쿼리 파서를 도입했어요.

LongAttnComp은 InfiniteBench Code-Debug에서 전체 컨텍스트 정확도에 맞춰 성능을 냈고, 기존 방식보다 훨씬 뛰어났으며, 세 가지 패밀리의 네 가지 모델로 이식 가능성을 입증했어요.

두 단계로 구성된 파인튜닝 레시피는 LongBench v2에서 다중 문서 추론 성능을 개선하면서 Code-Debug 성능을 유지했어요.

##LLM##장문컨텍스트##압축##LongAttnComp
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기