Pulse · AI 뉴스

LLM을 위한 최소 충분 표현 학습을 통한 도메인 특화 데이터 합성

DOMINO · 2026-05-29

연구진은 자연어 설명 없이 참고 예제만으로 도메인 특화 데이터를 합성하는 새로운 프레임워크 DOMINO를 제안했어요.

DOMINO는 참고 샘플로부터 최소 충분한 도메인 표현을 학습하고, 이를 활용해 도메인에 맞는 합성 데이터를 생성해요.

DOMINO는 프롬프트 튜닝과 대비 분리 목적을 결합하여 샘플별 노이즈를 줄이면서 핵심 도메인 특성을 보존하고, 코딩 벤치마크에서 Pass@1 정확도를 최대 4.63% 향상시켰어요.

##LLM##데이터합성##도메인적응##DOMINO##머신러닝
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기