생성형 AI로 비정형 문서에 대한 학습 인스턴스 모델 생성

이 항목에서는 계약서, 합의서, 보고서, 서신 및 이메일과 같은 비정형 문서에서 데이터를 추출하는 생성형 AI(GenAI) 기능을 활용하여 학습 인스턴스를 만드는 방법을 설명합니다.

생성형 AI를 사용하면 학습 인스턴스를 학습시키지 않고도 비정형 문서에서 데이터를 추출하는 학습 인스턴스를 만들 수 있습니다. 이는 빠르고 정확한 문서 처리에 매우 중요합니다. 비정형 문서에서 정확한 데이터를 추출할 수 있는 생성형 AI 기능을 사용하여 학습 인스턴스를 생성하는 단계를 살펴보겠습니다.

전제 조건

회사의 전문 개발자가 다음과 같은 태스크를 수행합니다.
  • 학습 인스턴스 생성, 편집, 삭제
  • 처리 및 테스트를 위한 문서 업로드
  • 개인 폴더에서 공용 폴더로 학습 인스턴스 체크인 및 체크아웃

라이선스 요구사항: 위 태스크를 수행할 수 있는 Bot Creator 라이선스.

할당된 역할 및 권한:
  • AAE_IQBot Services 또는 AAE_IQBot Admin
  • AAE_Basic

프로시저

  1. Control Room에 로그인하고 관리 > 학습 인스턴스로 이동한 다음, 학습 인스턴스 생성 버튼을 클릭하여 새 학습 인스턴스를 생성하기 시작합니다.
  2. 다음으로 학습 인스턴스 목록에서 쉽게 식별할 수 있도록 고유한 학습 인스턴스 이름을 입력하고 다음과 같은 옵션을 선택합니다.
    생성형 AI 기능으로 비정형 문서의 학습 인스턴스 생성
    1. 설명(선택 사항): 이 필드는 의미 있는 설명을 추가하고 학습 인스턴스의 사용을 요약하는 데 사용할 수 있는 선택 사항입니다.
    2. 문서 유형: 비정형 문서
      이 옵션을 선택하면 생성형 AI 기반 데이터 추출 기능이 활성화됩니다. 이 옵션은 비정형 문서 유형에 대해 기본적으로 활성화되어 있습니다.
    3. 언어: 영어
      현재는 영어만 지원합니다.
    4. 로케일: 문서의 로케일에 따릅니다.
      로케일은 사용자의 언어와 문서가 생성된 국가를 기준으로 선택됩니다.
    5. 공급자: Automation Anywhere(사용자 정의)
      현재는 이 옵션만 제공되므로 이 값이 기본적으로 선택되어 있습니다.
    6. OCR 공급자: Google Vision OCR 또는 ABBYY OCR
      ABBYY OCR에 대한 지원은 릴리스 v32부터 새롭게 도입되었습니다.
  3. 다음을 클릭하여 학습 인스턴스를 위한 양식 및 테이블 필드 생성을 시작합니다.
    양식 및 테이블 필드 생성과 관련된 자세한 내용은 Document Automation에서 학습 인스턴스 생성의 10~12단계에서 확인하십시오.
  4. 필드 추가를 클릭하여 문서에서 데이터를 추출할 각 데이터 요소 또는 엔터티에 대한 필드를 추가하기 시작합니다.
  5. 다음으로, 추출하려는 데이터 포인트와 관련된 필드 이름 과 기본 검색 쿼리를 만드는 데 사용되는 필드 레이블을 추가하고, 데이터 유형을 선택하여 필드 값 데이터 구조를 정의합니다.
    드롭다운에서 텍스트, 숫자, 날짜 또는 주소 데이터 유형 값 옵션 중에서 선택할 수 있습니다.
  6. 생성형 AI 기능을 활용하면 신뢰도 필드가 회색으로 표시됩니다. 해당 필드는 필수 또는 선택으로 설정할 수 있습니다.
  7. 생성형 AI 모델의 쿼리 검색 섹션에서, 시스템에서 생성된 쿼리를 사용하거나 사용자 정의 쿼리를 추가하는 옵션을 선택할 수 있습니다.
    예를 들어 총 비용에 대해서는 기본 생성형 AI 쿼리가 '총 비용이 얼마인가요?'를 표시합니다. 쿼리를 ‘총 비용은 얼마인가요? 통화 단위를 제외한 값을 추출하세요'로 변경할 수 있습니다. 이렇게 하면 통화 단위를 배제한 총 비용이 추출됩니다.
    Document Automation 기능을 사용하여 생성형 AI에서 학습 인스턴스에 대한 테이블 필드 만들기
  8. 다음 단계에서는 양식 및 테이블 필드에 대한 필드 규칙문서 규칙을 정의합니다.
    테이블 필드 만들기, 필드 규칙문서 규칙 추가하기에 관한 자세한 내용은 Document Automation에서 학습 인스턴스 생성Document Automation에서 학습 인스턴스를 생성하기 위한 레퍼런스 항목을 참조하십시오.
  9. v32부터는 테이블 필드 정의 프로세스에서 여러 테이블을 정의할 수 있습니다. 유스케이스에 따라 테이블 필드 드롭다운 옆에 있는 테이블 추가 아이콘을 클릭하여 추가 테이블을 정의할 수 있습니다.
    Document Automation에서 학습 인스턴스 생성의 12단계를 참조하십시오.
  10. 생성을 클릭하여 학습 인스턴스 생성을 완료합니다.

다음 단계

  1. 그런 다음 학습 인스턴스 자산을 공개 리포지토리에 게시합니다. 그러면 학습 인스턴스를 공개 모드에서 사용하여 실제 문서에서 데이터를 추출하고 유효성 검사기가 문서를 수동으로 검사할 수 있습니다. 학습 인스턴스를 프로덕션으로 게시 항목을 참조하십시오.
  2. 관리 > 학습 인스턴스 목록 페이지에서 방금 생성하여 게시된 학습 인스턴스를 식별하고 프로세스를 클릭하여 처리 및 데이터 추출을 위한 문서 업로드를 시작합니다. Document Automation에서 문서 처리 항목을 참조하십시오.
  3. 추출된 데이터가 포함된 CSV 문서를 열어 처리된 문서와 비교한 결과, 생성형 AI 지원 검색 쿼리 필드가 높은 정확도로 데이터를 추출했음을 확인할 수 있었습니다.