연구진은 LLM의 실행 피드백 기반 반복적인 솔루션 개선 능력에 주목해 자율 프로그래밍 AI 에이전트 A-ProS를 개발했어요.
A-ProS는 GPT-4와 GPT-5를 활용해 코드를 생성하고, Codestral-2508, Llama-3.3-70B, DeepSeek-R1 모델을 통해 디버깅하는 하이브리드 방식이에요.
ICPC World Finals와 Codeforces 문제를 통해 평가 결과, A-ProS는 기존 에이전트 대비 2배 이상의 성능 향상을 보여 신뢰성 있는 자율 프로그램 합성에 기여할 것으로 기대돼요.