강화 학습 알고리즘은 예상치 못한 방식으로 오류를 일으킬 수 있어요. 보상 함수를 잘못 지정하는 경우, 의도하지 않은 부작용이 발생할 수 있습니다. 이 글에서는 강화 학습 모델의 실패 원인 중 하나인 보상 함수 오류에 대해 살펴봅니다.