연구진은 의료 분야 LLM의 의사소통 방식이 임상 표준에 얼마나 부합하는지 다차원적으로 평가했어요. GPT-5와 Claude와 같은 대규모 모델은 의사보다 감정적 극성을 더 크게 나타내고, 언어적 복잡성도 높게 나타났어요. 공감적인 프롬프트나 공동 작성 방식이 LLM의 정렬성을 개선하는 데 도움이 되지만, 의사 수준을 넘어서지는 못했어요.