이 글에서는 Amazon S3에 있는 PDF 파일에서 실시간으로 텍스트를 추출하는 서버를 구축합니다. 프로토콜 기반 접근 방식으로 프로그래밍 방식으로 문서에 접근할 수 있습니다. 이 방법을 Amazon Textract와 비교하여 어떤 도구가 작업에 적합한지 결정할 수 있습니다.
서버 아키텍처, 서버 설정, 대화형 문서 쿼리를 단계별로 안내합니다. 실시간 PDF 텍스트 추출을 위한 프로토콜 기반 접근 방식을 제공합니다.
Amazon Textract와 비교하여 어떤 도구가 워크로드에 적합한지 판단할 수 있도록 돕습니다.