Omni-o3는 오디오-비주얼 추론 과정에서 중간 경로를 공유하여 효율성을 높이는 새로운 프레임워크예요. 10만 개의 데이터로 초기 학습하고, 1만 8천 개의 데이터로 강화 학습을 진행하여 심층적인 추론 능력을 키웠어요. 11개의 벤치마크 테스트에서 우수한 성능을 보여주며, 다양한 오디오-비주얼 추론 작업에서 뛰어난 능력을 발휘했어요.