연구진은 시계열 데이터를 활용한 건강 예측 모델의 일반화 성능을 높이기 위해 TimeSRL 프레임워크를 개발했어요.
TimeSRL은 LLM을 활용하여 원시 신호를 자연어 표현으로 추상화하고, 이를 바탕으로 행동 예측을 수행하여 데이터셋 간 성능 편차를 줄여요.
Group Relative Policy Optimization (GRPO)과 RLVR을 통해 강화 학습 방식으로 추상화 과정을 최적화하여, 불안과 우울증 예측에서 기존 모델 대비 MAE를 각각 3.1~10.1%, 3.2~9.6% 감소시켰어요.
TimeSRL은 다양한 센싱 파이프라인에서 뛰어난 성능을 보이며, 타겟 도메인 튜닝 없이도 자체 도메인 성능에 버금가는 결과를 보여줘요.