다중 모드 대형 언어 모델(MLLM)이 회로도를 RTL 코드로 변환하는 등 시각적 아티팩트를 코드로 변환하는 데 사용되고 있어요.
연구진은 '환상(Mirage)' 현상을 발견했는데, 이는 회로도를 빈 이미지로 대체해도 Pass@k 성능이 변하거나 오히려 향상되는 현상이에요. 모델이 시각적 입력 대신 모듈 헤더의 식별자 의미를 활용해 표준 RTL 템플릿을 검색하기 때문이에요.
VeriGround라는 새로운 모델을 개발했는데, 식별자 익명화, 거부 증강, D-ORPO 정렬을 통해 기존 모델보다 시각적 기반의 코드를 생성하는 데 더 효과적이에요.