독립 연구자가 LLM과 임베딩 기반 분류기의 한계점인 '익숙한 데이터'와 '새로운 노이즈' 구별의 어려움을 해결하기 위한 프로젝트를 진행하고 있습니다. 프로젝트는 입력에 대한 확률 벡터(P(class|input)) 대신, 0과 1 사이의 연속적인 친숙도 점수(μ(x))를 측정하는 이중 출력 시스템을 제안합니다. 연구자는 연구의 편향을 줄이기 위해 GitHub에 논문을 게시하고, 연구 내용에 대한 건설적인 비판과 의견을 구하고 있습니다.