OpenAI 연구진이 언어 모델의 오류나 부적절한 행동을 솔직하게 인정하도록 훈련하는 '자백(confessions)' 방법을 테스트하고 있어요. 자백 방식은 AI의 정직성, 투명성을 높여 모델 출력에 대한 신뢰를 구축하는 데 도움을 줄 수 있어요. 이를 통해 모델이 스스로 오류를 인지하고 개선하는 과정을 거치도록 유도하는 방식이에요.