연구진은 시각-언어 모델의 기하 문제 해결 과정에서 중간 상태가 검증 불가능하다는 문제를 지적했어요.
Draw2Think는 기하 추론을 잠재된 공간 추론에서 GeoGebra 제약 조건 엔진과의 상호 작용으로 재구성하는 프레임워크예요.
Draw2Think는 제안-그리기-검증 루프를 통해 가설을 실행 가능한 캔버스에 외부화하고 정확한 기하학적 양을 측정하며 모델에 구조화된 관찰 결과를 피드백하여 검증된 캔버스 상태를 기반으로 추론을 진행해요.
GeoGoal 데이터셋에서 95.9%의 속성 수준 건설 검사, 84.0%의 엄격한 문제 수준 건설 검사를 통과하며, 평면/입체 벤치마크에서 결과 정확도를 최대 4.1%/16.4% 향상시켰어요.