연구진은 복잡한 스프레드시트 작업을 자동화하는 AI 에이전트 개발을 위해 Spreadsheet-RL 프레임워크를 공개했어요.
Spreadsheet-RL은 온라인 포럼에서 수집한 스프레드시트 데이터를 활용하고, 금융 및 공급망 관리를 위한 평가 작업을 포함하는 Domain-Spreadsheet 벤치마크 데이터셋을 구축했어요.
Qwen3-4B-Thinking-2507 모델의 스프레드시트 작업 Pass@1 성능을 12.0%에서 23.4%로 향상시키는 등 LLM 기반 데이터 인터페이스 상호작용을 발전시키는 가능성을 보여줬어요.