연구진은 Mistral 3.1, DeepHermes, Qwen3 등 LLM을 활용해 독일어 인터뷰 샘플에서 치매와 우울증의 심각도를 예측하는 연구를 진행했어요. 기존 GDS와 연계한 GDS-D 스케일을 도입해 감정 및 인지 증상을 동시에 평가할 수 있도록 설계했어요. LLM 기반 특징 추출은 치매 평가 정확도를 35%까지 향상시키는 효과를 보였어요.
연구 결과, LLM은 초기 설정(zero-shot)에서 우울증 심각도를 효과적으로 예측했지만, 치매 평가는 구조화된 특징 추출을 통해 정확도가 크게 향상됐어요. 사람의 기록과 경쟁할 수 있는 성능을 보이는 일시 정지(pause) 정보가 풍부한 기록을 활용하면 자동화된 신경정신 질환 감별 진단 파이프라인 구축이 가능하다는 점을 확인했어요.
이번 연구는 LLM을 활용해 노년기 치매와 우울증을 평가하는 새로운 가능성을 제시하며, 임상 현장에서 활용될 수 있는 자동화된 진단 시스템 개발에 기여할 것으로 기대돼요.