SemEval-2026 Task 8에서 다중 턴 질문 답변 시스템을 평가했어요. 금융, 클라우드 문서, 정부, 위키피디아 등 4개 도메인을 다루며 답변 불가능한 질문도 포함돼요. 저희는 학습 기반 희소 검색과 LLM 기반 재순위화 및 생성을 결합한 RAG 파이프라인을 제안했어요.
희소 검색을 주 검색 방법으로 활용해 도메인 간 일반화 성능을 높였고, LLM의 장기 컨텍스트 기능을 활용해 대화형 쿼리 재작성, 포인트와 리스트 기반 재순위화, 최종 답변 생성을 수행했어요. 이를 통해 대화 맥락을 검색과 생성 과정에 효과적으로 통합했어요.