OpenAI가 ACKTR과 A2C 두 가지 새로운 베이스라인 구현체를 공개했어요. A2C는 A3C와 유사한 성능을 보이는 동기식, 결정론적 변형이에요. ACKTR은 TRPO 및 A2C보다 샘플 효율성이 높고, 업데이트당 약간 더 많은 계산량을 필요로 해요.