SHERPA는 텍스트-이미지 모델을 360° 파노라마 생성에 적응시키는 경량 프레임워크입니다. SHERPA는 이음매에 민감한 고주파수 영역의 Circular RoPE를 사용하고, Paired Panorama 경로와 Unpaired Style 경로를 통해 지도 및 비지도 학습을 수행합니다. 결과적으로 SHERPA는 사진과 같은 파노라마와 스타일화된 프롬프트 모두에서 360° 파노라마를 생성할 수 있습니다.