연구팀은 영어와 9개 인도어(아삼어, 벵골어, 구자라트어, 힌디어, 마라티어, 펀자브어, 타밀어, 텔루구어, 우르두어)를 지원하는 의료 대화 데이터셋 IndicMedDialog를 공개했어요.
MDDial 데이터셋을 기반으로 LLM이 생성한 의료 상담을 활용하고, TranslateGemma를 통해 번역 및 원어민 검수를 거쳐 데이터셋의 품질을 높였어요.
IndicMedLM 모델을 파인튜닝하여 다국어 환경에서 환자 맞춤형 증상 파악이 가능하도록 만들었으며, 의료 전문가의 검증을 통해 임상적 타당성을 확인했어요.