Transcoda는 실제 스캔 데이터 부족 문제를 해결하기 위해 데이터 중심의 합성 데이터 생성 파이프라인을 활용한 광학 음악 인식(OMR) 시스템입니다. 5900만 파라미터로 구성된 Transcoda 모델은 단일 GPU에서 6시간 만에 훈련되었으며, 기존의 훨씬 큰 모델보다 뛰어난 성능을 보였습니다. 새로운 벤치마크에서 18.46%의 OMR-NED 점수를 기록하며, 역사적인 폴란드 스캔 오류율을 63.97%까지 줄이는 성과를 거두었습니다.