Pulse · AI 뉴스

PRISM: 흐름 정제 및 불확실성 기반 구조 모델링을 통한 확산 기반 텍스트 이미지 초해상도

arXiv cs.CV · 2026-05-13

PRISM은 텍스트 이미지 초해상도(Text-SR)에서 시각적으로 자연스러운 디테일 합성 외에도, 획의 토폴로지에 오류가 발생하면 문자 식별이 바뀌고 가독성이 떨어질 수 있다는 점에 주목합니다.

FMPR(Flow-Matching Prior Rectification)은 저품질 입력에서 추출된 텍스트 조건을 개선하고, SURE(Structure-guided Uncertainty-aware Residual Encoder)는 불확실성 기반 구조 잔류 예측을 통해 미세한 획 경계를 개선합니다.

실험 결과, PRISM은 합성 및 실제 벤치마크에서 최고 성능을 달성했으며, 밀리초 단위의 추론 속도를 보였습니다.

##텍스트초해상도##이미지처리##딥러닝##확산모델
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기