데이터 추출 작업

Task BotsDocument Automation에 업로드된 문서를 처리하기 위해 데이터 추출 작업을 사용합니다.

Document Automation에서 학습 인스턴스를 생성할 때 Control Room이 자동으로 extractionbot을 생성합니다. 이 을 편집하려면 자동화 > 문서 워크스페이스 프로세스로 이동하여 학습 인스턴스와 동일한 이름을 가진 폴더를 선택하고 extractionbot을 엽니다.

다음 테이블은 작업 필드를 설명합니다.
주:
  • 프로세스가 중단될 수 있으므로 이러한 필드의 변수를 변경하지 않는 것이 좋습니다.
  • 다음과 같은 작업으로 을 생성하고 을 실행하면 오류가 표시됩니다.
    1. 고급 분류기 패키지의 문서 분류 작업을 사용하여 문서를 분류할 수 있습니다.
    2. 문서 추출 패키지에 있는 비정형 문서 유형의 학습 인스턴스를 사용하는 데이터 추출 작업을 사용하여 문서에서 데이터를 추출합니다.

    따라서 같은 에서 비정형 문서 유형의 학습 인스턴스 를 사용하는 문서 분류 작업 및 데이터 추출 작업을 사용하지 않는 것이 좋습니다.

  • 데이터 추출 작업IQ Bot Pre-processor, 문서 분류기 또는 OCR 작업과 함께 단일 에서 사용하면, 이 실패합니다. 그러나 IQ Bot Pre-processor, 문서 분류기, OCR 작업을 단일 에서 사용할 수 있습니다.

    해결 방법: IQ Bot Pre-processor, 문서 분류기 또는 OCR작업문서 추출 패키지의 데이터 추출 작업을 사용할 때는 별도의 Bot을 생성해야 합니다. 이러한 Bot을 순서대로 실행해야 하는 경우, 이러한 BotAutomation Co-Pilot 프로세스에 포함시키십시오.

필드 설명
추출할 문서 업로드된 문서의 파일 경로.
학습 인스턴스 이름 과 연결된 학습 인스턴스의 이름.
출력 결과 Document Automation 데이터를 저장할 위치를 지정합니다. 유스케이스에 따라 데이터를 Document Automation 서버에 업로드하거나 로컬 폴더에 저장할 수 있습니다.
  • 서버에 업로드: 추출 중에 생성된 데이터가 추가 처리(예: 유효성 검사)를 위해 서버에 업로드되고 나중에 데이터 다운로드을 실행하는 작업에 의해 다운로드됩니다.
  • 로컬 폴더에 저장: Document Automation에 의해 생성된 데이터가 서버로 전송되지 않고 지정된 폴더 경로에 저장됩니다.
    주: 이 옵션을 선택하면 Document Automation이 유효성 검사을 위해 파일을 전송하고 유효성 검사 대기열을 증가시킵니다. 그러나 Automation Co-Pilot 요청이 연결되어 있지 않으므로 Automation Co-Pilot 검증기에서 문서를 볼 수 없습니다. 또한 데이터 다운로드 작업을 실행하는 을 프로세스에서 제거할 수 있습니다. 이 옵션을 선택하면 프로세스 의 해당 단계가 중복되기 때문입니다.
추가 설정 항목을 참조하십시오.
(선택 사항) 응답을 기록으로 저장 대상 기록 변수에 대해 다음 탭 중 하나를 선택합니다.
  • 여러 변수: 키와 키가 매핑되는 변수를 제공하여 여러 변수에 출력을 저장합니다. 이 변수는 다음 유형 중 하나일 수 있습니다. 문자열, 숫자, 날짜 시간, 부울 등. 예를 들어 소스 기록 변수에 이름과 연락처 번호, 두 개의 항목이 포함된 경우 아래와 같이 출력을 저장할 수 있습니다.
    변수 매핑
    이름 StrName
    연락처 번호 MobileNo

    변수 StrNameMobileNo는 각각 문자열숫자 유형 변수입니다.

  • 기록: 기록 유형 변수에 출력을 저장합니다. 드롭다운 메뉴를 클릭하여 기존 변수를 선택하거나 새로 생성합니다.

추가 설정

다음 표에는 데이터 추출 작업의 기본값, Google Document AI, Microsoft OpenAI, Anthropic,IQ Bot 등 모든 추가 설정이 나열되어 있습니다. 외부 서비스에 대해 선택한 설정에 대한 라이선스 자격증명을 입력해야 합니다.

추가 설정 설명
없음 이는 추출 봇의 기본 옵션입니다. 외부 연결을 사용하지 않으려면 없음 옵션을 선택하면 됩니다.
Google DocAI
  • 서비스 계정: Google Document AI 보안 토큰이 포함된 라이선스 자격증명을 입력합니다. 자신의 자격증명을 사용하지 않으려면 없음 옵션을 선택합니다. 자격증명, 변수 또는 안전하지 않은 문자열 옵션을 사용하여 서비스 계정 자격증명을 입력합니다.
  • 문서 프로세서용 엔드포인트 URL: 서비스 계정의 URL을 입력합니다.
  • 클라우드 스토리지 버킷 이름(선택 사항): 클라우드 스토리지 버킷 이름을 입력합니다. 10페이지가 넘는 문서가 있는 경우, 입력 파일과 추출 결과가 이 버킷에 임시로 저장됩니다.
MS OpenAI
  • GPT용 서비스 계정: 자격증명, 변수 또는 안전하지 않은 문자열 옵션을 사용하여 쿼리할 AI 보안 토큰이 포함된 라이선스 자격증명을 입력합니다. 자신의 자격증명을 사용하지 않으려면 없음 옵션을 선택합니다.
  • GPT 모델용 엔드포인트 URL: 문서 처리 엔드포인트의 URL을 입력합니다. 예: https://{your-resource-name}.openai.azure.com/openai/deployments/{deployment-id}/chat/completions?api-version={api-version}
  • 임베딩용 서비스 계정: 자격증명, 변수 또는 보안되지 않은 문자열 옵션을 사용하여 임베드할 보안 토큰이 포함된 라이선스 자격증명을 입력합니다.Microsoft OpenAI 자신의 자격증명을 사용할 수도 있습니다.
  • ADA 모델용 엔드포인트 URL: 문서 처리 엔드포인트의 URL을 입력합니다. 예: https://{your-resource-name}.openai.azure.com/openai/deployments/{deployment-id}/embeddings?api-version={api-version}.
Anthropic Anthropic 모델을 사용하여 데이터 추출 항목을 참조하십시오.
IQ Bot(선택 사항) 그룹 레이블(선택 사항): 학습 인스턴스가 Automation 360 IQ Bot에서 생성되고 Document Automation에 연결된 경우 이 필드는 해당 문서 그룹 이름으로 자동으로 채워집니다(변수).