연구팀은 텍스트 기반으로 안과 수술 영상을 편집하는 새로운 프레임워크 'OphEdit'을 개발했습니다. 이 기술은 수술 도구 교체 및 절차 변경과 같은 복잡한 편집을 가능하게 합니다. OphEdit은 기존 영상의 Attention Value 텐서를 활용하여 해부학적 구조를 보존하면서 텍스트 기반의 의미 변경을 적용합니다.
OphEdit은 훈련 없이도 안과 수술 영상의 복잡한 구조를 유지하며 편집할 수 있어, 다양한 의료 데이터셋을 제작하는 데 유용합니다. 기존 영상 편집 기술보다 뛰어난 구조적 정확성과 시간 일관성을 보여줍니다. 연구팀은 GitHub을 통해 코드와 프롬프트를 공개했습니다.