연구진은 수동적인 PLM의 한계를 극복하기 위해 AgentPLM을 개발했어요. AgentPLM은 추론 기반 디코딩(RAD)과 CAPO라는 새로운 기술을 활용해 외부 생물리학적 피드백을 활용하고 오류를 수정합니다.
RAD는 autoregressive 생성과 ESMFold, FoldX, AutoDock Vina 같은 도구 호출을 반복하며, CAPO는 정책을 end-to-end로 훈련해 oracle 피드백의 유용성을 학습합니다.
AgentPLM은 효소 설계, 항체 최적화 등 다양한 벤치마크에서 기존 모델보다 뛰어난 성능을 보였으며, 항체 top-10% 히트율에서 가장 큰 향상을 기록했습니다.