Google Document AI용 추출 작업 사용

이 데이터 추출을 위해 문서를 Google Document AI로 보내고 출력을 JSON 형식으로 검색할 수 있도록 추출 작업을 구성합니다.

전제 조건

Google Cloud 계정에 로그인하고 프로세서 페이지로 이동하여 사용자 지정 엔드포인트를 검색합니다. 프로세서 엔드포인트 사용을 참고하십시오.

사용자 지정 엔드포인트는 다음 형식을 따라야 합니다. https://LOCATION-documentai.googleapis.com/API_VERSION/projects/PROJECT_ID/locations/LOCATION/processors/PROCESSOR_ID. 이 작업을 구성하려면 굵게 표시된 매개변수가 필요합니다.

프로시저

  1. Google Document AI > 추출 작업을 더블 클릭하거나 드래그합니다.
  2. 문서 파일 경로 필드에 처리할 문서의 파일 경로를 입력합니다.
    주: 루프 작업 내에서 이 작업을 사용하여 폴더의 모든 문서를 처리하는 경우 파일 이름이 포함된 변수와 확장자가 포함된 변수 사이에 마침표를 포함해야 합니다. 예: C:\Documents\$dictFile(name)$.$dictFile(extension)$.
  3. 사용자 지정 엔드포인트에 있는 다음 정보를 제공합니다.
    • 프로젝트 ID
    • 프로세서 ID
    • 위치
  4. 세션 이름 필드에 연결 작업에서 Google 서비스 계정에 연결하는 데 사용한 세션 이름을 입력합니다.
  5. 옵션: 출력을 저장할 문자를 변수를 선택하거나 생성합니다.
    작업은 데이터를 JSON 형식으로 반환합니다.
  6. 저장을 클릭합니다.

다음 단계

JSON 패키지작업을 사용하여 데이터를 구문 분석하고 특정 노드에서 값을 추출할 수 있습니다. 이 작업을 수행하는 방법에 대한 개요는 다음 단계를 참조하십시오.
  1. 세션 시작 작업을 사용하여 JSON 세션을 시작합니다. JSON 텍스트 필드에 추출 작업의 출력이 포함된 문자열 변수를 삽입합니다.
  2. 노드 값 가져오기 작업을 사용하여 Google Document AI > 추출 작업의 출력을 구문 분석하고 노드 값을 목록 변수에 지정합니다.

    노드 값 가져오기 작업 뒤에 루프 작업을 삽입하여 각 목록 항목을 반복하면서 각 노드 값에 대한 작업을 수행할 수 있습니다.

  3. 세션 종료 작업을 사용하여 JSON 세션을 종료합니다.