LLM 파라미터 편집 방법은 일반적으로 목표 레이어에서 이상적인 목표 은닉 상태를 계산하고 여러 이전 레이어로 목표 벡터를 분배하는 방식으로 작동합니다. 이 방식은 오랫동안 널리 사용되었지만, 그 기초가 체계적으로 조사된 적은 없습니다. 본 연구에서는 이 방식을 체계적으로 연구하여 능력의 한계, 실제 고려 사항, 잠재적 실패 모드를 명확히 합니다.
연구 결과, 역방향 전파를 순방향 전파로 대체하는 간단하고 우아한 대안을 제안했습니다. 마지막 편집 레이어에서 목표를 최적화하는 대신, 첫 번째 편집 레이어에서 앵커 포인트를 최적화하고 이를 순방향으로 전파하여 모든 후속 편집 레이어에 대한 정확하고 상호 호환 가능한 목표 은닉 상태를 얻습니다.
새로운 방식은 기존 방법과 동일한 계산 복잡성을 달성하면서 더 정확한 레이어별 목표를 생성하며, 기존 파이프라인에 영향을 주지 않아 다양한 LLM 파라미터 편집 방법에 도움이 됩니다.