Document Automation에서 학습 인스턴스를 생성할 때의 고려 사항
- 최종 업데이트2024/12/10
Document Automation에서 학습 인스턴스를 생성할 때의 고려 사항
학습 인스턴스를 만드는 동안 양식 및 테이블 필드, 검색 필드, 학습 인스턴스 생성 후 출력 폴더에 대한 추가 정보 등에 대해 다음 고려 사항을 염두에 두십시오.
필드 보기 및 검색
Document Automation은 표준 양식 및 테이블 필드 세트를 제공하며 이들 대부분은 처음에는 보이지 않습니다. 필드 이름, 필드 라벨 또는 데이터 유형으로 필드를 검색할 수 있습니다.
전체 필드 목록을 보려면 미사용 필드 표시를 클릭합니다. 데모는 다음 비디오를 참조하십시오.
필드 편집 및 사용자 정의 별칭 생성 가이드라인
- 필드의 속성은 대부분 편집할 수 있습니다.
- 이름과 기본 별칭은 편집할 수 없습니다. Document Automation은 하드 코딩된 키워드인 기본 별칭을 표준 필드에 할당하여 추출을 지원합니다.
- 기본 별칭을 수정하거나 삭제할 수 없지만 사용자 정의 별칭 필드에서 별칭을 추가할 수 있습니다.
사용자 정의 별칭을 만드는 방법에 대한 데모는 다음 비디오를 참조하십시오.
양식 및 테이블 필드에 대한 고려 사항
옵션 | 설명 |
---|---|
필드 이름 | 알파벳 문자(A~Z 또는 a~z)로 시작하는 필드 이름을 입력합니다. 표준 필드에서 필드 이름은 하드 코딩되어 있으며 변경할 수 없습니다. |
필드 라벨 | 유효성 검사기를 돕기 위해 사용자에게 친숙한 이름을 입력합니다. 예를 들어 조직 세금 번호를 VAT 번호와 같은 지역화된 이름으로 바꿀 수 있습니다. 필드 라벨은 추출에 영향을 미치지 않습니다. |
신뢰도 | 잠재적인 오탐률을 줄이기 위해 임계값을 설정합니다. 처리 시 Document Automation 엔진은 데이터가 올바르게 추출되었다는 확실성을 나타내기 위해 문서의 각 필드에 점수를 부여합니다. 문서에 신뢰 임계값보다 낮은 점수가 있는 필드가 있는 경우 해당 문서는 유효성 검사 대기열로 전송됩니다. 높은 신뢰 임계값을 입력하면 더 많은 문서가 유효성 검사 대기열로 보내집니다. 낮은 신뢰도 임계값을 입력하면 유효성 검사 대기열로 전송되는 문서가 줄어듭니다. 1에서 100까지의 값을 지원합니다. |
데이터 유형 | 다음 데이터 유형 중에서 선택하십시오.
필드의 데이터가 데이터 유형과 일치하지 않으면 문서가 유효성 검사 대기열로 보내집니다. Document Automation은 날짜 및 숫자 형식 변형을 지원합니다.* 사용자 정의 문서 유형으로 학습 인스턴스를 구성하는 경우, 양식 필드에는 주소의 전체 구조를 추출하는 주소 데이터 유형이 포함됩니다. |
날짜/숫자 형식 지정 | 추출된 날짜와 숫자를 특정 형식으로 변환하도록 표준 모양을 설정합니다. 이렇게 하면 데이터베이스 및 기타 기록 시스템에서 일관성과 정확성이 보장됩니다. 예를 들어, 날짜를 영어(미국) 로케일로 숫자를 표준화하도록 선택하고 처리된 문서에 |
필수 | 다음 중 하나를 선택합니다.
|
유효성 검사 피드백을 사용하여 정확도를 향상하십시오. | 필드에 대한 유효성 검사 피드백을 비활성화하거나 활성화합니다. 학습 인스턴스 생성 페이지에서 유효성 검사를 사용하여 정확도 향상 옵션을 선택하면, 이 옵션은 기본적으로 모든 필드에 대해 활성화됩니다. 이 옵션을 활성화하면 필드에 제공된 유효성 검사 피드백을 사용하여 데이터 추출 정확도가 향상됩니다. 그러나 유효성 검사 피드백이 필요 없이도 요구 사항에 맞게 필드 값이 추출되거나, 사전 학습된 모델이나 생성형 AI 제공자와 같은 대체 솔루션을 사용하여 데이터 추출을 개선해야 하는 경우, 이 옵션의 확인란을 선택 해제하여 필드에 대한 검사 피드백을 비활성화할 수 있습니다. 주:
|
기본 별칭 | 이 필드에 대해 별도의 조치는 필요하지 않습니다. Document Automation은 하드 코딩된 키워드인 기본 별칭을 표준 필드에 할당하여 추출을 지원합니다. |
사용자 정의 별칭 |
Document Automation이 필드를 찾는 데 도움이 되는 추가 키워드입니다. 예를 들어 VAT 번호와 같은 필드의 국가 또는 지역별 이름을 조직 세금 번호 사용자 정의 필드에 별칭으로 추가합니다. 최대 30개의 고유한 사용자 정의 별칭을 추가할 수 있습니다. 주: 사용자 정의 별칭은 고유해야 합니다. 다른 필드의 기본 별칭과 중복될 수 없습니다. 예외: 양식 필드가 테이블 필드로 중복된 사용자 정의 별칭을 가질 수 있으며 그 반대의 경우도 마찬가지입니다.
|
유효성 검사 규칙 | 데이터 유형에 따라 패턴, 수식, 목록 및 문(예: 다음으로 시작 또는 다음으로 종료)을 사용하여 규칙을 만듭니다. |
학습 인스턴스에서 사용자 정의 다중 테이블을 생성하거나 수정하기 위한 가이드라인
- 이 기능은 Automation Anywhere(사전 학습), Automation Anywhere(사용자 정의), IQ Bot - Document Automation로 Bridge 패키지, 비정형(생성형 AI) 문서 유형에 적용할 수 있습니다.
- 한 번에 하나의 테이블 필드에 대한 규칙을 설정할 수 있으며 다른 테이블에 속한 필드에는 규칙을 설정할 수 없습니다.
- 모든 필드 이름은 고유해야 합니다.
- 고급 학습 설정을 다중 테이블에 적용할 수 있습니다. 이는 테이블 전체가 아니라 각 테이블 단위로 작동합니다.
- 다중 테이블을 포함하는 학습 인스턴스를 가져오거나 내보내거나 복사할 수 있습니다.
- 학습 인스턴스에서 생성된 사용자 정의 테이블은 삭제할 수 있지만 기본 테이블은 삭제할 수 없습니다.
- 사용자 정의 다중 테이블 이름의 최대 글자 수는 50자, 열 이름의 최대 글자 수는 200자입니다.
- 테이블 이름 필드에는 영문과 숫자, 밑줄, 공백, 하이픈 문자만 입력할 수 있습니다.
- 학습 인스턴스를 생성하거나 수정하는 동안에는 테이블 이름을 변경할 수 없습니다.
- 표준 양식, Google Document AI, 선하증권, 운송장, 도착 통지서, 포장 명세서 문서 유형에는 다중 테이블 지원이 적용되지 않습니다.
- 출력(CSV) 파일은 모든 테이블 참조(기본 및 사용자 정의 다중 테이블)를 table_name: 필드 이름 형식으로 표시합니다.
Bot 출력 파일 및 폴더 구조
- 프로세스: 업로드된 문서에서 Document Automation 데이터를 추출하고, 유효성 검사를 위해 사용자에게 문서를 할당하고, 추출된 데이터를 다운로드하는 IF/Else 시나리오를 사용하여 프로세스를 관리합니다. 자세한 내용은 Document Automation의 비즈니스 유저용 Automation Co-Pilot 프로세스 항목을 참조하십시오.
- Extraction Bot: 업로드된 문서의 정의된 필드에서 데이터를 추출합니다.
- 다운로드 Bot: 추출된 데이터를 기기 또는 공유 네트워크의 특정 폴더로 다운로드합니다.
- 양식: 프로세스로 전송되는 입력 매개 변수를 정의합니다. 입력 매개 변수에는 학습 인스턴스 이름, 업로드된 파일 및 출력 파일 경로가 포함됩니다.