본 연구는 이미지 레벨과 픽셀 레벨 간의 불일치를 해결하기 위해 CLIP과 같은 비전-언어 모델을 활용한 오픈 보컬러벌리 시맨틱 세그멘테이션의 어려움을 다룹니다. HyRo 프레임워크는 포인케레 볼 모델에서 계층적 정렬과 의미 관계 정렬을 분리하여 하이퍼볼릭 공간에서의 의미 정렬을 개선합니다. HyRo는 기존 방법보다 뛰어난 성능을 보이며 오픈 보컬러벌리 시맨틱 세그멘테이션 벤치마크에서 최고 성능을 달성했습니다.