Pulse · AI 뉴스

IndicMedDialog: 9개 인도어 지원 의료 대화 데이터셋 공개

IndicMedDialog · 2026-05-13

연구팀은 영어와 9개 인도어(아삼어, 벵골어, 구자라트어, 힌디어, 마라티어, 펀자브어, 타밀어, 텔루구어, 우르두어)를 지원하는 의료 대화 데이터셋 IndicMedDialog를 공개했어요.

MDDial 데이터셋을 기반으로 LLM이 생성한 의료 상담을 활용하고, TranslateGemma를 통해 번역 및 원어민 검수를 거쳐 데이터셋의 품질을 높였어요.

IndicMedLM 모델을 파인튜닝하여 다국어 환경에서 환자 맞춤형 증상 파악이 가능하도록 만들었으며, 의료 전문가의 검증을 통해 임상적 타당성을 확인했어요.

##의료AI##다국어##데이터셋##IndicMedDialog
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기