연구진은 법률 문서의 효율적인 분류를 위해 lemmatisation 전처리, FastText 임베딩, 다중 커널 1차원 CNN을 결합한 경량화된 프레임워크를 개발했어요.
개발된 시스템은 25,000개의 법률 문서 데이터셋에서 97.26%의 정확도와 96.82%의 F1 점수를 기록하며, BERT와 같은 기존 모델을 능가하는 성능을 보여줬어요.
이 모델은 510만 개의 파라미터로 구성되어 있으며, 문서당 0.31ms의 추론 지연 시간을 보여, BERT보다 13배 빠른 속도를 자랑하며 법률 문서 분석에 효율적인 대안을 제시했어요.