본 논문에서는 큐비트 매핑 문제를 조합 최적화 문제로 정의하고, 강화 학습 정책을 훈련하여 해결하는 새로운 방법인 CO-MAP을 제시합니다. 기존 양자 컴파일러에 비해 SWAP 오버헤드를 65~85% 줄이는 성능 향상을 보였습니다. MQTBench 및 Queko 회로와 같은 실제 데이터셋에서 기존 양자 컴파일러보다 SWAP 오버헤드를 크게 줄이는 데 성공했습니다.