문서 추출 개요

문서 추출 프로세스를 사용하면 문서에서 추출할 특정 양식 및 테이블 필드를 정의할 수 있습니다.

그러면 시스템은 이러한 문서에서 지정된 데이터를 자동으로 추출하여 추가 분석하고 다운스트림 워크플로에 통합합니다. 이 프로세스는 데이터 처리의 효율성, 정확성, 전반적인 생산성을 향상시킵니다.

사용자가 새 학습 인스턴스를 생성하면 Control Room에서 자동화 > 문서 워크스페이스 폴더에 해당 학습 인스턴스와 동일한 이름을 가진 폴더를 자동으로 생성합니다. 해당 폴더 내에서 Control Room이 다음 두 Bot을 생성합니다.

  • Extraction Bot: 업로드된 문서의 정의된 필드에서 데이터를 추출합니다.
  • 봇 다운로드: 다운로드 에서 구성된 출력 결과 옵션에 따라 추출된 데이터를 기기 또는 공유 네트워크의 특정 폴더에 다운로드합니다.

문서 추출 패키지가 문서에서 데이터를 추출하고, 추출된 데이터를 특정 위치로 다운로드하는 데 사용됩니다.

문서 추출 패키지는 다음과 같은 기능을 제공합니다.

  • 다양한 문서 유형: 다양한 문서 처리 유스케이스에 맞게 광범위한 문서 유형을 처리합니다. 사용자 정의 데이터 추출 파서를 통합하여 문서 처리 워크플로에 사전 학습된 도메인별 모델을 활용할 수 있습니다.
  • 유효성 검사 규칙: 패턴 일치 또는 동등성 검사와 같은 다양한 조건을 정의합니다. 이러한 조건이 충족되면 오류 또는 경고에 플래그를 지정하거나, 값을 정리하거나 바꾸거나, 새 값을 설정하는 조치를 빠르게 취할 수 있습니다. 이러한 규칙을 사용하면 문서의 여러 필드에서 추출된 데이터의 정확성을 보장할 수 있습니다.
  • 생성형 AI 공급자: 또는 과 같은 Azure OpenAI생성형 AIAnthropic의 사전 학습된 모델을 사용하여 여러 문서 유형에서 데이터를 추출하십시오. 사용자는 필드를 한 번 구성할 때 검색 쿼리를 정의할 수 있으며, 그 후에는 처리된 모든 문서에 대해 추가 구성 없이 데이터가 추출됩니다.
  • 유효성 검사 피드백: 추출된 데이터를 검증하고 수정하여 추출된 데이터의 정확성에 대한 피드백을 제공합니다. 이 프로세스는 시간이 지남에 따라 시스템이 데이터 정확도를 지속적으로 향상시키는 데 도움이 되는 피드백 루프를 생성합니다.
  • Automation Co-Pilot 유효성 검사기: 문서의 오류나 경고를 강조하기 위한 사용자 친화적인 인터페이스를 제공합니다. 유효성 검사기는 유효성 검사가 필요한 필드에 빨간색 윤곽선을 표시합니다. 사용자는 이러한 필드의 데이터를 유효성 검사하고 다시 처리하기 위해 문서를 제출할 수 있습니다.
  • Automation 360과의 통합: 추출된 데이터를 Automation 360에서 추가 처리를 위해 다양한 워크플로에 원활하게 통합합니다.