Pulse · AI 뉴스

MIRA: 중간 학습 단계에서 데이터 선택을 위한 소스 기반 루브릭 앵커링

MIRA · 2026-05-29

MIRA는 LLM 중간 학습 단계의 데이터 선택 문제를 해결하기 위해 소스 기반 루브릭 발견을 활용하는 새로운 프레임워크입니다.

MIRA는 각 소스 그룹에 대해 평가해야 할 항목을 먼저 발견한 후, 이를 학생 스코어러로 증류하여 전체 코퍼스 필터링을 수행합니다.

21개 소스와 5개 소스 그룹으로 구성된 코드 중심 중간 학습에서 MIRA는 9개의 코드 벤치마크에서 기존 데이터 선택 방법보다 뛰어난 성능을 보였습니다.

##LLM##데이터선택##중간학습##MIRA##코드
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기