CogScale은 시퀀스 정보 처리 능력 평가를 위한 14개의 확장 가능 합성 작업 벤치마크입니다. 연구자들은 이 벤치마크를 통해 대규모 훈련에 투자하기 전에 새로운 아키텍처 혁신을 빠르게 검증할 수 있습니다. GRU, LSTM, Mamba, Transformer 등 7가지 아키텍처를 평가한 결과, 복잡도가 증가할수록 어텐션 메커니즘과 최신 상태 공간 모델이 높은 성능을 유지했습니다.