대형 언어 모델(LLM)이 화학 분야의 반응 예측, 구조 규명 등 과학적 발견을 지원하는 데 활용되면서 분자 구조에 대한 이해가 중요해지고 있습니다.
연구진은 LLM을 위한 새로운 분자 표현 방식인 MolJSON을 도입하고, 기존 5가지 화학 형식과 성능을 비교 분석했습니다.
MolJSON은 IUPAC 명칭 번역 정확도, 제약 조건 하의 생성 정확도, 최단 경로 추론 성공률 등에서 기존 형식보다 우수한 성능을 보여 LLM 기반 화학 시스템에 적합한 것으로 나타났습니다.