연구진은 다중 도메인 단백질의 복잡한 결합 예측 문제를 해결하기 위해 HCLBind 프레임워크를 개발했어요. HCLBind는 Q-BioLiP 데이터베이스를 활용한 사전 학습을 통해 단백질 결합의 물리적 규칙을 학습합니다. 단일 도메인 단백질과 다중 도메인 복합체의 구조적 특징을 고려한 계층적 속임수 전략을 사용했어요.
HCLBind는 도메인 게이트 그래프 어텐션 네트워크와 교차 모달 어텐션을 결합하여 인터페이스 특징을 우선적으로 학습하며, LoRA를 활용하여 효율적인 최적화를 가능하게 합니다. PDBBind 데이터셋 실험 결과, 기존 방식보다 뛰어난 성능과 불확실성 추정 능력을 보여줬어요.
연구 코드는 GitHub 저장소에서 확인할 수 있습니다 (https://github.com/jiankliu/HCLBind).