연구팀은 인간 삽입 시 발생하는 부자연스러운 자세, 인원수 불일치, 얼굴 식별 변경 문제를 해결하기 위해 InsHuman을 제안했습니다.
InsHuman은 Human-Background Adaptive Fusion(HBAF)을 통해 예측된 이미지와 실제 이미지의 인간 영역을 정렬하고, Face-to-Face ID-Preserving(FFIP)을 통해 얼굴 식별 일관성을 유지합니다.
Bidirectional Data Pairing(BDP) 전략을 활용하여 실제 인간-배경 상호작용을 반영한 고품질 데이터셋 BDP-InsHuman을 구축했습니다.