연구진은 시간-계열 질문 답변(TSQA)의 토큰화 문제 해결을 위해 CADE(Contrastive Alignment with Direct Embedding) 프레임워크를 제안했어요.
CADE는 각 타임스텝을 LLM 임베딩 공간에 직접 매핑하여 정확한 인덱스 접근을 유지하고 패칭 및 패딩의 필요성을 없앴어요.
새로운 대비 정렬 손실 함수를 통해 시간-계열 임베딩과 언어 표현 간의 의미 격차를 줄여 Time-MQA 벤치마크에서 기존 LLM보다 성능이 향상됐어요.