연구진은 모든 쿼비트 간 연결을 가진 장치용 클리퍼드 양자 회로 합성을 강화 학습 문제로 접근했습니다. 에이전트는 주어진 클리퍼드 회로의 symplectic 행렬 표현을 항등식으로 줄이는 일련의 기본 클리퍼드 게이트를 학습합니다. 이 방식은 쿼비트 수에 관계없이 단일 학습 정책을 적용할 수 있는 size-agnostic 신경망 아키텍처를 도입했습니다.
6개의 쿼비트 클리퍼드 회로에서 에이전트는 최적의 회로와 2개의 쿼비트 게이트 이내의 회로를 밀리초당 인스턴스당 찾습니다. 10개의 쿼비트 인스턴스에 대한 지속적인 학습 후, 에이전트는 30개의 쿼비트까지의 미지의 클리퍼드 테이블로 확장됩니다.
Qiskit의 Aaronson-Gottesman 및 탐욕적 클리퍼드 합성기보다 더 낮은 평균 2쿼비트 게이트 수를 달성합니다.