연구자는 Claude Code와 협력하여 텍스트의 진위 여부를 판별하는 Kora Sapphire Suite라는 시스템을 개발했습니다. 이 시스템은 신경망 없이 45개의 언어 프로토콜과 로지스틱 회귀를 사용하여 작동하며, 128K 컨텍스트를 지원합니다.
HippoCorpus 데이터셋에서 이 시스템은 0.712의 AUC (Area Under the Curve)를 기록했으며, 이는 기존의 RoBERTa 모델과 유사한 성능입니다. 특히, 구조적 언어 프로토콜이 성능 향상에 기여하는 것으로 나타났습니다.
흥미롭게도, 이 시스템은 훈련 데이터에 없는 '재구술'된 이야기도 정확하게 분류하여, 기억의 인지적 근원이 구조적 흔적을 남긴다는 것을 시사합니다. 현재 이 시스템은 단일 데이터셋에 대한 검증을 받았으며, 추가적인 검증과 LIWC + L1 기준선 비교가 필요합니다.