연구진은 자연어 설명을 기반으로 과학적 아키텍처 다이어그램을 생성하는 데이터셋인 Text2Arch를 공개했습니다. Text2Arch는 과학적 아키텍처 이미지, 텍스트 설명, DOT 코드 표현을 포함하며, 이를 활용하여 언어 모델을 튜닝하고 GPT-4o를 사용한 인컨텍스트 학습을 수행했습니다. Text2Arch 모델은 기존 모델보다 성능이 뛰어나며 GPT-4o의 인컨텍스트 학습 기반 생성과 유사한 수준의 성능을 보였습니다.