데이터 추출 워크플로에서 사전 처리 사용

사전 처리와 데이터 추출을 모두 포함하는 문서 처리 워크플로를 간소화하기 위해 사전 처리 태스크를 문서 처리 워크플로에 통합할 수 있습니다. 이러한 통합을 통해 수동 문서 사전 처리가 필요 없게 되어 단일 워크플로 내에서 두 작업을 순차적으로 처리하는 통합되고 자동화된 워크플로가 가능해졌습니다.

전제 조건

이 프로세스에 사용하려는 학습 인스턴스를 생성하고 프로덕션에 게시했는지 확인하십시오. 학습 인스턴스를 프로덕션으로 게시 항목을 참조하십시오.

이 절차에서는 Pre-processor 패키지의 이미지 향상 작업을 사용하고 이에 따라 변수를 생성했습니다. 선택한 Pre-processor 작업에 따라 절차를 수정하고 다양한 변수 집합을 만들어야 할 수도 있습니다.

프로시저

  1. Control Room에 로그인합니다.
  2. 자동화 > 개인 탭으로 이동합니다.
  3. 만들기 > Task Bot을 클릭합니다.
    문서 워크스페이스 프로세스 폴더에는 을 배치하지 마십시오.
  4. 에 Doc-processing-with-classification과 같은 이름을 지정합니다.
  5. 다음 변수를 생성합니다.
    변수 이름 설명 데이터 유형
    SourcePath 사전 처리할 문서가 들어 있는 폴더에 대한 파일 경로 문자열 사전 처리할 문서가 위치한 파일 경로를 입력하십시오.
    PreProcessedFilePath 사전 처리된 문서가 들어 있는 폴더에 대한 파일 경로 문자열 사전 처리된 문서가 있는 파일 경로를 입력하십시오.
    OutputPath 추출된 데이터 및 유효하지 않거나 실패한 문서가 포함된 폴더의 파일 경로 문자열 추출 출력의 원하는 파일 경로를 입력합니다.
    FilesInFolderPreProcessing 파일 이름 및 확장명을 보관합니다. 사전 해당 없음
    FilesInFolderDataProcessing 파일 이름 및 확장명을 보관합니다. 사전 해당 없음

    변수 만들기 항목을 참조하십시오.

  6. 루프 작업을 삽입하여 모든 문서를 반복하여 특정 파일 경로로 분류합니다.
    1. 루프 작업을 더블 클릭하거나 드래그하여 편집기로 끌어 놓습니다.
    2. 폴더 내 각 파일 대상 반복자를 선택합니다.
    3. 폴더 경로 필드에 $SourcePath$를 입력합니다.
    4. 이 변수에 파일 이름과 확장자 지정 필드에 $FilesInFolderPreProcessing$을 입력합니다.
    루프 패키지 항목을 참조하십시오.
  7. 문서 사전 처리를 위한 작업을 구성합니다.
    1. Pre-processor 에 있는 이미지 향상패키지 작업을 루프 컨테이너로 드래그합니다.
    2. 입력 파일 필드에서 바탕 화면 파일 옵션을 선택하고 $SourcePath$/$FilesInFolder{name}$.$FilesInFolder{extension}$을 입력합니다.
    3. 출력 경로 필드에서 바탕 화면 폴더 옵션을 선택하고 $PreProcessedFilePath$를 입력합니다.
    IQ Bot Pre-processor 패키지 항목을 참조하십시오.
  8. 루프 작업을 삽입하여 특정 파일 경로 내에서 데이터 처리를 위한 모든 문서를 반복합니다.
    1. 루프 작업을 더블 클릭하거나 드래그하여 편집기로 끌어 놓습니다.
    2. 폴더 내 각 파일 대상 반복자를 선택합니다.
    3. 폴더 경로 필드에 $PreProcessedFilePath$ 를 입력합니다.
    4. 이 변수에 파일 이름과 확장자 지정 필드에 $FilesInFolderDataProcessing$을 입력합니다.
    루프 패키지 항목을 참조하십시오.
  9. 특정 학습 인스턴스와 연결된 프로세스에 문서를 업로드하도록 작업을 구성합니다.
    1. 에 있는 Process Composer요청 만들기패키지 작업을 루프 컨테이너로 드래그합니다.
    2. 공개 프로세스 필드에서 찾아보기를 클릭하고 공개 모드에서 사용할 수 있는 학습 인스턴스를 선택합니다.
    3. 파일 “InputFile” 필드에서 바탕 화면 파일 옵션을 선택하고 $PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$을 입력합니다.
    4. 문자열 “InputFileName” 필드에 $FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$을 입력합니다.
    5. 문자열 “OutputFolder” 필드에 $OutputPath$를 입력합니다.
    Process Composer 패키지 항목을 참조하십시오.
  10. 파일 패키지를 사용하면 다음 작업을 수행할 수 있습니다.
    • 바탕 화면 파일 복사 작업을 사용하면 성공적으로 처리된 파일의 복사본을 바탕 화면의 다른 위치에 만들 수 있습니다. 예를 들어 소스 파일 필드에 $PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$을 입력합니다.
    • 삭제 작업을 사용하면 Document Automation에 업로드된 문서를 제거할 수 있습니다. 예를 들어 File 필드에 $PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$을 입력합니다.

    텍스트 파일 패키지 항목을 참조하십시오.

  11. 저장을 클릭합니다.
이제 이 자동화를 실행하면 문서가 먼저 사전 처리되어 이미지 품질을 향상시킨 다음 학습 인스턴스에서 데이터 추출에 사용됩니다.