연구진은 분자 구조와 자연어 간의 연결을 강화하기 위해 BiMol-Diff라는 새로운 디퓨전 프레임워크를 개발했어요.
BiMol-Diff는 분자 생성 및 캡셔닝 작업을 동시에 수행하며, 각 토큰의 복구 난이도에 따라 노이즈 스케줄을 조정하여 분자 구조의 중요한 부분을 보존해요.
ChEBI-20 및 M3-20M 데이터셋에서 BiMol-Diff는 기존 모델 대비 정확히 일치하는 결과에서 15.4%의 향상을 보였고, 캡셔닝 작업에서도 뛰어난 성능을 보여줬어요.