GenCape은 범주 불문 포즈 추정(CAPE)을 위한 새로운 프레임워크로, 이미지 기반 지원 입력에서만 키포인트 관계를 추론합니다. i-SVAE는 변분 추론을 통해 지원 특징에서 구조 정보를 추출하고, CGT 모듈은 여러 잠재 그래프를 결합하여 쿼리에 맞는 구조를 생성합니다. MP-100 데이터셋 실험 결과, GenCape은 기존 그래프 기반 모델보다 우수한 성능을 보이며, 텍스트 기반 모델과도 경쟁력 있는 성능을 유지했습니다.