Pulse · AI 뉴스

CoSPlay: 자체 생성 코드 및 단위 테스트를 활용한 테스트 시간 협력적 자기 학습

Qwen · 2026-05-22

연구진은 Ground-Truth 단위 테스트(GT UT)의 한계를 극복하기 위해 CoSPlay 프레임워크를 개발했어요.

CoSPlay는 코드와 단위 테스트를 공동으로 개선하는 방식으로, 자체 생성된 단위 테스트를 활용하여 코드 후보를 개선하고 선택해요.

Qwen2-5-7B-Instruct 모델에서 BoN(Begin of Next) 성능을 22.1%에서 33.2%로, 단위 테스트 정확도를 14.6%에서 78.3%로 향상시켰어요.

CoSPlay는 GT 데이터 없이도 경쟁력 있는 코드 생성을 위한 확장 가능한 추론 전략을 제시하며, CURE-7B 모델 성능 향상에도 기여했어요.

##코드생성##자기학습##단위테스트##Qwen
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기