데이터 추출 작업

Task BotDocument Automation에 업로드된 문서를 처리하기 위해 데이터 추출 작업을 사용합니다.

Document Automation에서 학습 인스턴스를 생성할 때 Control Room이 자동으로 extractionbot을 생성합니다. 이 Bot을 편집하려면 자동화 > 문서 워크스페이스로 이동하여 학습 인스턴스와 동일한 이름을 가진 폴더를 선택하고 extractionbot을 엽니다.

다음 테이블은 작업 필드를 설명합니다.
주: 프로세스가 중단될 수 있으므로 이러한 필드의 변수를 변경하지 않는 것이 좋습니다.
필드 설명
추출할 문서 업로드된 문서의 파일 경로
학습 인스턴스 이름 Bot과 연결된 학습 인스턴스의 이름
출력 결과 Document Automation 데이터를 저장할 위치를 지정합니다. 유스케이스에 따라 데이터를 Document Automation 서버에 업로드하거나 로컬 폴더에 저장할 수 있습니다.
  • Document Automation 서버에 다음과 같이 업로드합니다. 추출 중에 생성된 데이터가 추가 처리(예: 유효성 검사)를 위해 서버에 업로드되고 나중에 데이터 다운로드작업을 실행하는 Bot에 의해 다운로드됩니다.
  • 로컬 폴더에 저장: Document Automation에 의해 생성된 데이터가 서버로 전송되지 않고 지정된 폴더 경로에 저장됩니다.
    주: 이 옵션을 선택하면 Document Automation이 유효성 검사를 위해 파일을 보내지 않습니다. 이를 위해서는 Document Automation 서버를 사용해야 하기 때문입니다. 또한 데이터 다운로드 작업을 실행하는 Bot을 프로세스에서 제거할 수 있습니다. 이 옵션을 선택하면 프로세스 Bot의 단계가 반복되기 때문에 필요하지 않습니다.

추가 설정

다음 표에는 데이터 추출 작업에서 기본값, Google Document AI, Microsoft OpenAI, IQ Bot 등 모든 추가 설정이 나열되어 있습니다. 외부 서비스에 대해 선택한 설정에 대한 라이선스 자격증명을 입력해야 합니다.

추가 설정 설명
없음 추출봇의 기본 설정입니다. 자격증명으로 외부 연결을 사용하지 않으려면 없음 옵션을 선택할 수 있습니다.
Google Document AI
  • 서비스 계정: Google Document AI 보안 토큰이 포함된 라이선스 자격증명을 입력합니다. 자신의 자격증명을 사용하지 않으려면 없음옵션을 선택합니다.
    • 자격증명: 라이선스 자격증명을 선택합니다.
    • 변수: 사용자의 이메일 주소에 대한 정보가 포함된 자격증명 변수를 사용합니다.
    • 안전하지 않은 문자열: 사용자 이메일 주소를 문자열로 입력합니다.
  • 문서 프로세서용 엔드포인트 URL: 서비스 계정의 URL을 입력합니다.
  • 클라우드 스토리지 버킷 이름(선택 사항): 클라우드 스토리지 버킷 이름을 입력합니다. 10페이지가 넘는 문서가 있는 경우, 입력 파일과 추출 결과가 이 버킷에 임시로 저장됩니다.
Microsoft OpenAI
  • GPT용 서비스 계정: 자격증명, 변수 또는 안전하지 않은 문자열 옵션을 사용하여 쿼리할 AI 보안 토큰이 포함된 라이선스 자격증명을 입력합니다. 자신의 자격증명을 사용하지 않으려면 없음옵션을 선택합니다.
  • GPT 모델용 엔드포인트 URL: 문서 처리 엔드포인트의 URL을 입력합니다.
  • 임베딩용 서비스 계정: 자격증명, 변수 또는 보안되지 않은 문자열 옵션을 사용하여 임베드할 보안 토큰이 포함된 라이선스 자격증명을 입력합니다.Google Document AI 자신의 자격증명을 사용할 수도 있습니다.
  • ADA 모델용 엔드포인트 URL: 문서 처리 엔드포인트의 URL을 입력합니다.
IQ Bot(선택 사항) 그룹 레이블(선택 사항): 학습 인스턴스가 Automation 360 IQ Bot에서 생성되고 Document Automation에 연결된 경우 이 필드는 해당 문서 그룹 이름으로 자동 채워집니다(변수).
대상 기록 변수 선택 필드를 사용하여 대상 기록 변수에 대해 다음 탭 중 하나를 선택합니다.
  • 여러 변수: 키와 키가 매핑되는 변수를 제공하여 여러 변수에 출력을 저장합니다. 변수는 문자열, 숫자, 날짜 시간, 부울 등과 같은 다음 유형 중 하나일 수 있습니다. 예를 들어 소스 기록 변수에 이름과 연락처, 두 개의 항목이 포함된 경우 아래와 같이 출력을 저장할 수 있습니다.
    변수 매핑
    이름 StrName
    연락처 번호 MobileNo

    변수 StrNameMobileNo는 각각 문자열숫자 유형 변수입니다.

  • 기록: 기록 유형 변수에 출력을 저장합니다. 변수 선택 드롭다운을 클릭하여 기존 변수를 선택하거나 새로 생성합니다.