연구진은 신용 위험 예측에서 데이터 표현 전략이 모델 아키텍처 선택보다 더 중요하다고 밝혔습니다. 테이블 기반 파운데이션 모델(TFM)을 사용할 때 균형 잡힌 샘플링 전략은 AUC 점수를 3~4점 향상시킵니다. 5~10K개의 균형 잡힌 데이터로 TFM을 학습하면 전체 데이터를 사용한 기존 모델 수준의 AUC를 달성할 수 있습니다.
데이터 표현 전략은 모델 아키텍처 선택보다 TFM 배포 시 주요 고려 사항입니다. 기존 GBDT 모델보다 높은 디폴트 클래스 재현율을 회복할 수 있습니다.