본 연구는 대규모 언어 모델(LLM)의 안정성을 분석하기 위해 불확실성과 혼란 조건 하에서 모델 출력을 평가하는 새로운 프레임워크를 제안했어요. 제안된 프레임워크는 작업 유틸리티, 엔트로피, 내부 통합 및 정렬된 반사 능력과 같은 지표를 통합하여 복합 안정성 점수를 산출해요. IST-20 벤치마킹 프로토콜을 사용하여 4개의 LLM 모델 시나리오를 분석한 결과, 제안된 프레임워크는 기존 방식보다 더 높은 안정성 점수를 얻었어요.