연구진은 연방 학습 기반 수술 AI 모델 선택 시 발생할 수 있는 일반화 실패 문제를 지적했어요. 성능 누수(performance leakage) 현상을 막기 위한 GEN-Guard 프레임워크를 제안했어요. GEN-Guard는 일반화 탐지(CBE)와 불일치 기반 증류(DAD) 기술을 활용해 교차 기관 간의 강건성을 높여요.
기존 평가 방식으로는 최대 80%의 모델 선택 실패(MSF)가 발생했지만, GEN-Guard는 최대 2~3점의 F1 점수 향상을 보여줬어요. 이는 수술 단계 인식 및 용종 분할 작업에서 확인됐어요.
GEN-Guard는 표준 연방 학습 완료 후에도 적용 가능하며, 새로운 환경에 대한 제로샷 적응을 지원해요. 연구 결과, 성능 누수는 연방 학습 기반 수술 AI의 중요한 위험 요인으로 확인됐어요.