Pulse · AI 뉴스

HydraLM: 22배 빠른 디코딩과 16배 작은 상태 메모리를 갖춘 장문 컨텍스트 추론 모델

HydraLM · 2026-04-23

HydraLM은 장문 컨텍스트 추론을 위한 모델로, 벤치마크 결과 100만 토큰 테스트에서 90% 깊이에 숨겨진 사실을 1.00의 정확도로 검색합니다.

이 모델은 추론 속도를 최대 1.8배 향상시키고, FLOP 및 메모리 사용량을 각각 99.8% 절감하는 결과를 보여줍니다.

HydraLM의 벤치마크 문서, 재현 스크립트, 검증 로그는 공개되어 있어 누구나 결과를 직접 확인할 수 있습니다.

##모델출시##장문컨텍스트##추론

매일 핵심 AI 소식을 한국어로, 빠르게