Pulse · AI 뉴스

이미지 분류에서 비전-언어 모델을 활용한 지역화된 컨포멀 예측

arXiv cs.CV · 2026-06-30

연구진이 비전-언어 모델(VLM)을 활용한 이미지 분류 분야의 지역화된 컨포멀 예측 알고리즘을 공개했어요. 기존 방식의 문제점을 개선하기 위해 코사인 유사도 변환을 제안해 주변 영역과의 유사성을 고려한 예측 정확도를 높였어요. 관련 코드는 GitHub에서 확인할 수 있어요.

기존 컨포멀 예측 방식은 조건부 보장 달성이 어렵다는 한계가 있었어요. 연구진은 테스트 시간 샘플과 교정 예제의 유사성을 기반으로 컨포멀 집합을 조정하는 접근 방식을 사용했어요. 하지만 VLM을 활용한 이미지 분류에서는 효과가 미미했어요.

연구진은 코사인 유사도를 단순 비선형 변환하여 주변 영역과의 유사성을 고려한 예측 정확도를 높였고, 이는 기존 방식보다 통계적으로 유의미한 집합 크기 감소를 달성했어요.

##이미지분류##컨포멀예측##비전언어모델##VLMs
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기