Deepseek V4의 100만 토큰 컨텍스트 윈도우 성능을 실제 코드 기반으로 테스트한 결과, 15만~25만 토큰 사이에서 최적의 성능을 보였습니다.
18만 토큰 규모의 코드에서 멀티 파일 리팩토링 시에도 일관된 아키텍처 이해도를 보여주었지만, 30만 토큰을 넘어서면 정확도가 저하되는 경향을 보였습니다.
100만 토큰 컨텍스트 윈도우는 기술적으로 작동하지만, 프롬프트 엔지니어링 기법에 대한 주의가 필요하며, 생산 환경에서는 검증 레이어가 필요합니다.
최적 활용 범위를 벗어난 컨텍스트에서는 존재하지 않는 유틸리티 함수를 참조하는 등 환각 현상이 나타나 주의가 필요합니다.