연구진은 환자 기록을 자연어 시퀀스로 처리하는 LLM의 임상 예측 성능을 높이기 위해 Medical Token-Pair Encoding(MedTPE) 기술을 제안했습니다.
MedTPE는 자주 함께 등장하는 의료 토큰 쌍을 결합하여 최대 31% 토큰 길이를 줄이고 추론 지연 시간을 34~63% 단축했습니다.
실제 데이터셋 실험 결과, MedTPE는 예측 성능과 출력 형식 준수율을 유지하거나 향상시키며 다양한 LLM과 임상 예측 작업에 적용 가능했습니다.