LASA는 장면 스케치 의미 분할을 위한 약한 감독 방법입니다. 이 방법은 다양한 카테고리 어휘를 활용하여 드로잉에 의미 레이블을 할당합니다. LASA는 여러 Vision Transformer 레이어의 어텐션 맵을 결합하여 구조적 선행을 강화하고 예측을 개선합니다.
FS-COCO, SFSD, FrISS 데이터셋에서 LASA는 기존 약한 감독 기반 모델보다 mIoU를 각각 3.43%, 8.01%, 15.74% 향상시켰습니다. 이는 분할 정확도와 공간 일관성 모두에서 향상을 보여줍니다.
LASA의 소스 코드는 공개될 예정입니다.