Pulse · AI 뉴스

SEGA3D: 3D 시각-언어 분할의 새로운 패러다임

SEGA3D · 2026-06-09

연구진이 3D 시각-언어 분할을 위한 새로운 패러다임인 SEGA3D를 제안했어요. 기존 방식의 낮은 품질과 부정확한 객체 경계를 개선하기 위해 세밀한 시각 정보를 직접 활용하는 방식이에요.

SEGA3D는 마스크 후보 생성기를 통해 고품질의 후보 마스크를 제공하고, LLM과 Semantic-Spatial Selector (SSS)를 활용해 최적의 마스크 후보를 선택해요.

ScanRefer, ScanNet, Matterport3D 벤치마크에서 경쟁력을 입증했으며, 특히 ScanNet과 Matterport3D에서 최고 성능 모델보다 각각 8.3 mIoU, 5.3 mIoU 향상된 결과를 보여줬어요.

##3D##시각언어##분할##SEGA3D##LLM
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기