Pulse · AI 뉴스

Claude Code와 함께 만든 텍스트 진위 판별 시스템, 신경망 없이 로지스틱 회귀만으로 HippoCorpus에서 0.712 AUC 달성

Claude · 2026-05-11

연구자는 Claude Code와 협력하여 텍스트의 진위 여부를 판별하는 Kora Sapphire Suite라는 시스템을 개발했습니다. 이 시스템은 신경망 없이 45개의 언어 프로토콜과 로지스틱 회귀를 사용하여 작동하며, 128K 컨텍스트를 지원합니다.

HippoCorpus 데이터셋에서 이 시스템은 0.712의 AUC (Area Under the Curve)를 기록했으며, 이는 기존의 RoBERTa 모델과 유사한 성능입니다. 특히, 구조적 언어 프로토콜이 성능 향상에 기여하는 것으로 나타났습니다.

흥미롭게도, 이 시스템은 훈련 데이터에 없는 '재구술'된 이야기도 정확하게 분류하여, 기억의 인지적 근원이 구조적 흔적을 남긴다는 것을 시사합니다. 현재 이 시스템은 단일 데이터셋에 대한 검증을 받았으며, 추가적인 검증과 LIWC + L1 기준선 비교가 필요합니다.

##텍스트분석##진위판별##ClaudeCode

매일 핵심 AI 소식을 한국어로, 빠르게