생성형 AI를 통해 다음 반정형 문서에 대한 학습 인스턴스 모델 생성

이 주제를 가이드로 삼아 반정형 문서(예: 송장, 사용자 정의 및 구매 주문서) 또는 다음과 같은 공급망 문서에서 데이터를 추출하는 생성형 AI(생성형 AI) 기능을 활용하여 학습 인스턴스를 만들 수 있습니다. 도착 통지서, 선하증권, 포장 명세서 및 운송장.

반정형 문서에서 데이터를 추출하는 경우, 사용자는 학습 인스턴스 생성 시 유효성 검사를 사용하여 정확도 향상 옵션을 선택하여 기본으로 제공되는 사용자 유효성 검사 피드백 기능에 더해 생성형 AI 기능을 사용할 수 있습니다. 따라서 즉각적인 정확도를 통해 일관되고 향상된 데이터 추출을 보장합니다. 반정형 문서에서 정확한 날짜를 추출할 수 있는 생성형 AI 기능을 사용하여 학습 인스턴스를 생성하는 단계를 살펴보겠습니다.

전제 조건

  • 공급망 문서의 경우 생성형 AI 기반 데이터 추출 기능이 기본적으로 활성화되어 있으며 비활성화할 수 없습니다. 따라서생성형 AI 및 기타 외부 연결을 활성화해야 Document Automation 오류 없이 문서를 처리할 수 있습니다. 생성형 AI 및 기타 Document Automation에 대한 외부 연결 활성화 항목을 참조하십시오.
  • 회사의 전문 개발자가 다음과 같은 태스크를 수행합니다.
    • 학습 인스턴스 생성, 편집, 삭제
    • 처리 및 테스트를 위한 문서 업로드
    • 개인 폴더에서 공용 폴더로 학습 인스턴스 체크인 및 체크아웃
  • 라이선스 요구 사항: 위 태스크를 수행할 수 있는 Bot Creator 라이선스.

  • 할당된 역할 및 권한:
    • AAE_IQBot Services 또는 AAE_IQBot Admin
    • AAE_Basic

프로시저

  1. Control Room에 로그인하고 AI > Document Automation 으로 이동한 다음, 학습 인스턴스 생성 버튼을 클릭하여 새 학습 인스턴스를 생성하기 시작합니다.
  2. 다음으로 학습 인스턴스 목록에서 쉽게 식별할 수 있도록 고유한 학습 인스턴스 이름을 입력하고 다음과 같은 옵션을 선택합니다.
    생성형 AI 기능을 통해 반정형 문서의 학습 인스턴스 생성
    1. 설명(선택 사항): 이 필드는 의미 있는 설명을 추가하고 학습 인스턴스의 사용을 요약하는 데 사용할 수 있는 선택 사항입니다.
    2. 문서 유형: 다음과 같이 사용 가능한 반정형 문서 목록에서 선택합니다. 송장, 사용자 정의 문서, 도착 통지서, 선하증권, 포장 명세서, 운송장.
      이 옵션을 선택하면 기본적으로 제공되는 유효성 검사를 사용하여 정확도 향상 기능과 생성형 AI 기반 데이터 추출 기능이 활성화되며, 이 기능은 유효성 검사 프로세스 중 유효성 검사기에 대한 사용자 변경 사항에서 시스템에 전송된 피드백을 기반으로 합니다. 이는 사용자 유효성 검사 피드백과 생성형 AI 기능을 결합하여 더 나은 데이터 추출 결과를 보장하므로, 반정형 문서에 매우 중요한 기능입니다.
    3. 언어: 영어
      현재는 영어만 지원합니다.
    4. 로케일: 문서의 로케일에 따릅니다.
      로케일은 사용자의 언어와 문서가 생성된 국가를 기준으로 선택됩니다.
    5. 공급자: Automation Anywhere(사용자 정의)
    6. OCR 제공자: Google Vision OCR 또는 ABBYY OCR
      지원되는 두 가지 OCR 옵션 중에서 선택할 수 있습니다.
  3. 다음을 클릭하여 학습 인스턴스를 위한 양식 및 테이블 필드 생성을 시작합니다. v32부터는 양식 및 테이블 필드 모두에서 생성형 AI 기능을 사용할 수 있습니다. 기본 사용자 정의 별칭 지원과 더불어 GenAI 기능을 사용할 수 있습니다. 필드에 별칭을 추가하는 방법에 대한 자세한 내용은 Document Automation에서 학습 인스턴스 생성, 9단계를 참조하십시오.
    Document Automation은 반정형 문서에 대하여 사용자 정의 별칭 및 피드백 기능을 기본적으로 사용합니다. 신뢰도가 낮고 필드 데이터가 누락된 필드에 대한 쿼리는 추출을 위해 생성형 AI로 전달됩니다.
    생성형 AI를 사용하는 검색 쿼리를 통한 반정형 문서의 학습 인스턴스
  4. 테이블 필드에 대한 생성형 AI 기능을 사용해 열을 식별하면 테이블 열을 중심으로 데이터를 추출할 수 있습니다. 이 기능은 테이블 추출에 매우 유용한 기능입니다. GenAI는 문서를 학습하지 않아도 정의된 검색 쿼리를 기반으로 특정 테이블 열을 식별할 수 있습니다. 이는 Document Automation에서 즉시 사용 가능한 기능입니다. 따라서 GenAI 지원 검색 쿼리를 사용하여 열을 식별한 다음, Document Automation 추출 모델을 사용하여 해당 열에서 필드에 대한 특정 데이터를 추출할 수 있습니다.
  5. 다음으로, 추출하려는 데이터 포인트와 관련된 필드 이름과 기본 검색 쿼리를 만드는 데 사용되는 필드 레이블을 추가하고, 데이터 유형을 선택하여 필드 값 데이터 구조를 정의합니다.
    드롭다운에서 텍스트, 숫자, 날짜 또는 주소 데이터 유형 값 옵션 중에서 선택할 수 있습니다. 양식 필드 생성에 대한 자세한 내용은 Document Automation에서 학습 인스턴스 생성, 10단계를 참조하십시오.
  6. 양식 및 테이블 필드를 필수 또는 선택으로 설정할 수 있습니다. 생성형 AI 기능을 활용하면 신뢰도 필드가 회색으로 표시됩니다.
  7. 추출에 패턴을 사용하는 추출 필드 기능을 사용할 수 있는 추가 옵션이 있습니다.
  8. 생성형 AI 모델의 쿼리 검색 섹션에서, 시스템에서 생성된 쿼리를 사용하거나 사용자 정의 쿼리를 추가하는 옵션을 선택할 수 있습니다.
    예를 들어 주소 필드에는 기본 생성형 AI 쿼리가 \'집 주소가 무엇인가요?\'를 표시합니다. ‘도시와 주가 포함된 집 주소는 무엇인가요?\'로 쿼리를 사용자 정의할 수 있습니다.
  9. 다음 단계로 양식과 테이블 필드에 대한 필드 규칙문서 규칙을 정의하고 생성을 클릭하여 학습 인스턴스 생성을 완료합니다. 양식 및 문서 규칙 정의에 대한 자세한 내용은 다음을 참조하십시오. Document Automation의 유효성 검사 규칙.

다음 단계

  1. 그런 다음 학습 인스턴스 자산을 공개 리포지토리에 게시합니다. 그러면 학습 인스턴스를 공개 모드에서 사용하여 실제 문서에서 데이터를 추출하고 유효성 검사기가 문서를 수동으로 검사할 수 있습니다. 학습 인스턴스를 프로덕션으로 게시 항목을 참조하십시오.
  2. AI > Document Automation 목록 페이지에서 방금 생성하여 게시된 학습 인스턴스를 식별하고 프로세스를 클릭하여 처리 및 데이터 추출을 위한 문서 업로드를 시작합니다. Document Automation에서 문서 처리 항목을 참조하십시오.
  3. 추출된 데이터가 포함된 CSV 문서를 열어 처리된 문서와 비교한 결과, Marcus는 생성형 AI 지원 검색 쿼리 필드가 높은 정확도로 데이터를 추출했음을 확인할 수 있었습니다.