연구자가 평가 기반 금융 연구 RAG 어시스턴트 'TrustRAG Finance'를 구축하여, 확신을 가진 오류를 주요 실패 모드로 취급하는 RAG 시스템 설계 방법을 테스트했어요.
시스템은 하이브리드 검색, 다중 LLM 합성, 구조화된 인용 답변, 클레임 수준 검증 등 다양한 기능을 포함하며, 시스템 신호 기반의 자신감 점수를 활용해요.
현재 API가 배포되어 작동 중이며, GitHub 저장소를 통해 코드를 확인할 수 있으며, 피드백을 받고 있어요.