연구진은 복잡한 불완전 정보 게임 해결 알고리즘인 CFR 연산의 실시간 병렬화 프레임워크 'Parallel CFR'을 개발했어요. 이 프레임워크는 가지치기, 추상화, 고급 CFR 변형을 통합하여 CPU와 GPU를 효율적으로 활용합니다. Heads-Up No-Limit Texas Hold'em 실험 결과, 단일 스레드 대비 3.3~3.4배 속도 향상을 보였으며, 47~54ms 내에 10억 개 이상의 히스토리를 처리했습니다.
Parallel CFR은 정보 집합 및 트리 노드 기반의 병렬화 두 가지 차원을 활용하며, 잎 노드 평가는 GPU를 통해 배치 신경망 추론으로 처리하여 이종 CPU-GPU 파이프라인을 구축합니다. 이 기술은 특별한 데이터센터 인프라 없이도 실시간 의사 결정 예산 내에서 수백 번의 CFR 반복을 가능하게 합니다.
이번 연구는 단일 데스크톱 장치(NVIDIA DGX Spark)에서 진행되었으며, CFR 연산의 실시간 성능 향상에 기여할 것으로 기대됩니다.