Pulse · AI 뉴스

데이터 표현이 아키텍처보다 중요: 테이블 기반 파운데이션 모델의 신용 위험 예측을 위한 리샘플링 전략

Hugging Face · 2026-05-19

연구진은 신용 위험 예측에서 데이터 표현 전략이 모델 아키텍처 선택보다 더 중요하다고 밝혔습니다. 테이블 기반 파운데이션 모델(TFM)을 사용할 때 균형 잡힌 샘플링 전략은 AUC 점수를 3~4점 향상시킵니다. 5~10K개의 균형 잡힌 데이터로 TFM을 학습하면 전체 데이터를 사용한 기존 모델 수준의 AUC를 달성할 수 있습니다.

데이터 표현 전략은 모델 아키텍처 선택보다 TFM 배포 시 주요 고려 사항입니다. 기존 GBDT 모델보다 높은 디폴트 클래스 재현율을 회복할 수 있습니다.

##신용위험##테이블모델##리샘플링##TFM##데이터표현
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기