Pulse · AI 뉴스

SWE-rebench 리더보드 업데이트: GLM-5.2, Qwen3.6-27B 등 새로운 모델 추가 및 UI 개선

Qwen · 2026-07-01

SWE-rebench 리더보드에 Claude Opus 4.8 xhigh, GLM-5.2, Gemini 3.5 Flash 등 새로운 모델이 추가됐어요. 이번 업데이트에서는 리더보드 UI를 개선해 결과 비교 및 이해를 돕고 있어요. Qwen3.6-27B는 크기에 비해 뛰어난 성능을 보여주고, Gemma 4 31B도 비교를 위해 추가됐어요.

리더보드에서는 코딩 성능을 평가하는 SWE-rebench 결과를 확인할 수 있으며, 사용자는 GitHub, Slack, Jira 등 다양한 플랫폼에서 활용 가능해요. 새로운 모델에 대한 의견을 공유하고, 추가 테스트 모델을 제안할 수 있어요.

리더보드, Discord, X 게시물, Harbor 등 관련 링크를 통해 더 자세한 정보를 확인할 수 있으며, 사용자는 SWE-rebench 리더보드를 통해 다양한 모델의 성능을 비교 분석할 수 있어요.

##모델출시##벤치마크##SWE-rebench
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기