연구진은 3~4B 파라미터의 소형 언어 모델(SLM)을 LoRA 방식으로 튜닝하여 9가지 방사선학 과제에서 뛰어난 성능을 달성하고, 소비자용 CPU에서도 활용할 수 있음을 확인했습니다.
Qwen2.5-3B-Instruct와 Qwen3-4B 모델을 162K 샘플로 튜닝한 결과, RADS 정확도는 53%, NLI는 60%, N/M 스테이징은 89% 향상되었습니다.
모델을 GGUF 형식으로 양자화하여 1.8~2.4GB 크기로 만들었으며, 소비자용 하드웨어에서 4~8 토큰/초의 속도로 CPU 배포가 가능합니다.