Pulse · AI 뉴스

ART: 예술 기반 강화 학습으로 멀티모달 LLM 미세 조정

Qwen · 2026-06-10

연구진은 vLLM과 같은 고처리량 엔진에서 지원하지 않는 LoRA, Soft Prompting의 한계를 극복하기 위해 ART(Art-based Reinforcement Training)라는 새로운 미세 조정 방법을 제안했어요.

ART는 시각적 입력만 최적화하여 동결된 멀티모달 LLM에 정보를 주입하고, 기존의 계산 그래프를 활용하여 Soft Prompting 방식을 지원하며, 최적화된 시각적 입력은 작업 관련 예술 작품으로 스타일화할 수 있어요.

실험 결과, ART는 인기 있는 오픈소스 Qwen 아키텍처의 다양한 크기에서 수학 및 구조화된 도구 사용 벤치마크에서 LoRA와 경쟁력 있는 정확도를 달성했어요.

##미세조정##멀티모달##강화학습##Qwen##ART
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기