Pulse · AI 뉴스

가치 제약 기반 신용 할당: 완전 위임 AI 협동조합

arXiv cs.AI · 2026-06-27

연구진은 인간의 가치 제약을 고려한 AI 협동조합의 보상 할당 프레임워크를 제안했어요. 각 주체의 가치 프로필을 기준으로 업데이트를 검토하여 허용 가능한 업데이트만 신용하는 방식이에요. 트래버설 러닝(TL)을 기반으로 가치 조건부 그래디언트 필터링, 온라인 마진 기여 신호, 누적 수익 정산을 수행해요.

TL은 품질 손실 없이 분산 역전파를 수행하고, 연합 학습보다 명확한 트래버설 및 그래디언트 경로를 보존하여 더 세밀한 귀속 기반을 제공해요. 데이터 가치 평가, 연합 기여 추정, 개인화 연합 학습, 다원주의 정렬과 관련하여 프레임워크를 제시해요.

연구는 완전 위임 AI 협동조합에서 인간의 데이터를 기여하고 모델 업데이트에 참여하는 주체들의 가치 제약을 고려한 보상 할당 문제를 해결하는 데 기여할 수 있어요.

##AI협동조합##트래버설러닝##가치정렬##분산학습##AI윤리

매일 핵심 AI 소식을 한국어로, 빠르게

App Store 에서 Pulse 받기 앱에서 열기