연구진은 LLM에서 미세 조정 시 발생하는 새로운 현상인 '발현적 잘못 정렬(Emergent Misalignment, EM)'에 대해 조사했어요.
옵티마이저 선택이 EM 심각도에 가장 큰 영향을 미치며, 7배의 차이를 발생시켰고, 모델 크기는 Qwen3 모델군 내에서 무시할 만한 영향을 미쳤어요.
연구 결과, 옵티마이저 선택이 EM 심각도를 줄이는 핵심 요소이며, 스펙트럼 정규화가 EM에 취약한 옵티마이저의 영향을 크게 완화할 수 있음을 확인했어요.