연구진은 LLM을 활용해 레이블 데이터 없이도 특징을 추출하는 새로운 프레임워크를 개발했어요. 이 프레임워크는 이분 분류 및 상위 k개 식별 문제에 적용 가능하며, IBD 환자 진단에 활용됐어요. 기존 방식보다 어려운 환자의 경우, 진단 정확도가 크게 향상됐으며, LLM 자체의 추출 능력보다 우수한 성능을 보였어요.
기존 AFA 방식은 레이블 데이터 의존성이 높았지만, 이번 연구는 LLM의 지식과 순차적 계획 능력을 분리해 데이터 의존성을 낮췄어요. LLM에게 신뢰할 수 있는 정보(단일 변동 및 쌍별 공분산)만 요청하는 방식으로 진행됐어요.
연구 결과, LLM은 클래스를 분리하는 차별적인 통계 정보만 안정적으로 제공하며, 최대 엔트로피 폐쇄를 통해 불확실성을 해소했어요. IBD 환자 진단에서 기존 방법보다 뛰어난 성능을 보이며, 임상적 활용 가능성을 확인했어요.