UniSteer는 LLM의 내부 표현을 제어하는 새로운 기술로, 자연어 조건을 기반으로 활성화 흐름 매칭 모델을 학습합니다. 기존 방식과 달리 특정 행동에 맞춰 개별 개입 모듈을 만들 필요 없이, 활성화 공간에서 범용적인 조건부 속도장을 학습합니다. 세 가지 LLM에 대한 실험 결과, 행동 제어, 진실성 제어, 미세한 개념 제어, 다중 제약 조건 따르기, 활성화 공간 분류 등 다양한 작업에 적용 가능성을 보였습니다.