연구진은 PROTAC 활성 예측 모델의 일반화 격차를 분해하여 실험실 간 측정 분산이 주요 원인임을 밝혔습니다. 랜덤 분할은 대상 내 보간을 장려하는 반면, leave-one-target-out (LOTO) 프로토콜은 새로운 대상 예측 능력을 측정합니다. 8개의 아키텍처와 ESM-2 단백질 언어 모델을 사용한 LOTO AUROC는 약 0.67로 정체되었으며, 21차원 하이퍼파라미터 최적화로도 이 천장을 뚫을 수 없었습니다.