이 글에서는 NVIDIA의 Nemotron을 활용하여 RAG(Retrieval-Augmented Generation) 시스템을 위한 문서 처리 파이프라인을 구축하는 방법을 소개합니다.
복잡한 PDF 파일을 즉시 파싱하고, 중첩된 테이블을 추출하며, 차트 내의 데이터를 텍스트 파일 읽듯이 쉽게 처리할 수 있는 AI 에이전트 구축을 목표로 합니다.
NVIDIA의 기술을 통해 문서 데이터에서 의미 있는 정보를 추출하고 RAG 시스템의 성능을 향상시키는 방법을 단계별로 안내합니다.