Pulse · AI 뉴스

Gemma 4 E2B 변종 안전 장치 제거 실험 결과: 일부 모델 성능 향상, 주장과 실제 불일치

Gemma · 2026-05-31

DreamFast의 Nathan Dreamfast가 Gemma 4 E2B 모델의 13개 변종을 안전 장치 제거, KL 발산, HarmBench 안전성, 8개 벤치마크 테스트했습니다.

안전 장치 제거는 13개 변종 모두에서 HarmBench ASR을 32.2%에서 82%~100%로 끌어올렸으며, 일부 변종은 추론 능력을 향상시키기도 했습니다.

coder3101 변종은 ASR 96%를 달성하고 수학 문제 해결 능력이 기준 모델보다 뛰어나며, 모델 카드에 표기된 안전 장치 제거 효과 주장은 실제와 차이가 있는 경우가 많았습니다.

##Gemma##LLM##안전장치##벤치마크##Abliterlitics
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기