Pulse · AI 뉴스

심리적 안전망 구축: LLM의 심리 기반 거절 프레임워크 'PsychoSafe'

Qwen · 2026-06-08

연구진이 LLM의 윤리적 거절을 심리적 지원으로 재구성하는 프레임워크 'PsychoSafe'를 개발했어요. 위기 상황이나 강압적 의도가 있는 요청에 대해 단순 거절 대신 심리적 지지를 제공하는 방식입니다.

PsychoSafe는 5가지 심리적 위험 영역을 포괄하는 8019개 프롬프트-응답 쌍을 활용해 Qwen 3.5 27B 모델을 프롬프팅하고 파라미터 효율적인 파인튜닝을 거쳤어요.

평가 결과, PsychoSafe는 기존 방식 대비 거절 품질을 28.1% 향상시켰으며, 외부 자원 연계 및 심리적 기반 강화에 특히 강점을 보였어요.

##LLM##윤리##심리학##안전
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기