Pulse · AI 뉴스

Evil Spectra: 옵티마이저가 잘못 정렬된 행동을 증폭시키거나 억제하는 방법

Qwen · 2026-06-30

연구진은 LLM에서 미세 조정 시 발생하는 새로운 현상인 '발현적 잘못 정렬(Emergent Misalignment, EM)'에 대해 조사했어요.

옵티마이저 선택이 EM 심각도에 가장 큰 영향을 미치며, 7배의 차이를 발생시켰고, 모델 크기는 Qwen3 모델군 내에서 무시할 만한 영향을 미쳤어요.

연구 결과, 옵티마이저 선택이 EM 심각도를 줄이는 핵심 요소이며, 스펙트럼 정규화가 EM에 취약한 옵티마이저의 영향을 크게 완화할 수 있음을 확인했어요.

##LLM##옵티마이저##EmergentMisalignmen##Qwen3
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기