연구진은 자연어 처리(NLP)와 머신러닝(ML) 기술을 활용해 정신 질환 진단 설명을 국제질병분류(ICD) 코드로 자동 매핑하는 방법을 제안했어요.
145,513건의 스페인어 정신 질환 설명 데이터셋을 활용한 결과, e5_large 모델이 0.866의 F1 점수를 기록하며 가장 높은 성능을 보여줬어요.
연구는 대규모 언어 모델(LLM)을 특정 임상 명칭에 적응시키는 것이 장기적인 레이블 분포와 정신 의학 담론의 모호성을 극복하는 데 필수적임을 보여줘요.