문서 추출 패키지 업데이트

새로운 기능과 향상된 기능, 수정 사항 및 제한 사항 등 릴리스된 문서 추출 패키지 버전의 업데이트를 확인해 보십시오. 이 페이지에는 각 버전의 릴리스 날짜와 호환 가능한 Control RoomBot 에이전트 버전도 나열되어 있습니다.

버전 요약

다음 테이블에는 Automation 360 릴리스 또는 패키지 전용 릴리스로 릴리스된 문서 추출 패키지 버전이 나열되어 있습니다(릴리스 날짜의 내림차순). 해당 패키지 버전의 업데이트에 대한 정보를 보려면 버전 링크를 클릭하십시오.
버전 릴리스 날짜 릴리스 유형 Bot 에이전트 버전 Control Room 빌드
문서 추출 패키지 업데이트 2024년 4월 5일 Automation 360 v.32(온프레미스) 릴리스 포함 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2024년 3월 21일 Automation 360 v.32(샌드박스) 릴리스 포함 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2024년 1월 26일 패키지 전용, Automation 360 v.31 릴리스 후 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2023년 12월 22일 패키지 전용, Automation 360 v.31(샌드박스) 릴리스 후 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2023년 12월 6일 Automation 360 v.31(샌드박스) 릴리스 포함 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2023년 11월 28일 Automation 360 v.30 릴리스 포함 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2023년 11월 16일 패키지 전용, Automation 360 v.30 릴리스 후 21.252 이상 19223 이상
3.30.24 2023년 9월 21일 패키지 전용, Automation 360 v.30(샌드박스) 릴리스 후 21.252 이상 19223 이상
3.30.22 2023년 9월 6일 Automation 360 v.30(샌드박스) 릴리스 포함 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2023년 8월 21일 패키지-전용, Automation 360 v.29 이후 21.98 이상 15345 이상
3.30.19 2023년 8월 16일 패키지-전용, Automation 360 v.29 이후 21.98 이상 15345 이상
문서 추출 패키지 업데이트 2023년 7월 17일 패키지 전용, Automation 360 v.29 릴리스 후 21.98 이상 15345 이상
문서 추출 패키지 업데이트 2023년 6월 6일 Automation 360 v.29(샌드박스) 릴리스 포함 21.98 이상 15345 이상
주:
  • 개별 패키지(Automation 360 릴리스에서 패키지만 원하는 경우 업데이트됨)를 다운로드하려면 이 URL을 사용합니다.

    https://aai-artifacts.my.automationanywhere.digital/packages/<package-file-name>-<version.number>.jar

  • 문서 추출 패키지의 경우 명명 규칙은 다음과 같습니다. bot-command-iqbot-extraction360-<version-number>-full.jar

    예: bot-command-iqbot-extraction360-3.31.22-full.jar

패키지를 다운로드하고 Control Room에 수동으로 추가하는 자세한 단계는 Control Room에 패키지 추가 항목을 참조하십시오.

3.32.23

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
이제 사용자는 Bot 에이전트 머신에서 프록시가 활성화된 경우 Document Automation 환경에서 유효성 검사 피드백을 저장할 수 있습니다.

서비스 클라우드 케이스 ID: 02092484

Google Vision OCR 및 프록시를 활성화하면 더 이상 비정형 문서에 대해 문서 추출이 실패하지 않으며 오류 메시지가 표시되지 않습니다.

서비스 클라우드 케이스 ID: 02104409

3.32.22

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
이제 테이블 끝 표시기가 추가되어 향상된 문서 테이블 감지 모델을 통해 모든 페이지의 테이블 데이터에서 선택한 언어의 데이터를 추출할 수 있습니다. 따라서 페이지에서 누락된 테이블과 마지막 행 추출 문제를 줄일 수 있습니다.

서비스 클라우드 케이스 ID: 02065073

테이블 추출 기능이 개선되어 비정형 테이블에 더 이상 정크 값이 표시되지 않으며 테이블 데이터가 성공적으로 추출됩니다.

3.31.22

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
학습 인스턴스에 유효성 검사 피드백을 추가하면 더 이상 오류 메시지와 함께 문서 추출이 실패하지 않습니다.

이전에는 유효성 검사 확인란을 선택하면 문서 추출이 실패했습니다.

학습 인스턴스에 유효성 검사 피드백을 추가하면 문서의 모든 페이지에 있는 모든 테이블에 대한 피드백이 저장되고 모든 페이지에서 데이터가 올바르게 추출됩니다.

이전에는 모든 페이지에 대한 피드백이 저장되지 않았습니다.

서비스 클라우드 케이스 ID: 01995135, 02093575, 02093389

유효성 검사 피드백을 추가한 후 테이블 ID가 일치하면 이제 모든 페이지의 모든 테이블에서 데이터가 추출되어 유효성 검사기에 표시됩니다.

이전에는 이러한 경우 일부 페이지를 건너뛰고 모든 페이지의 데이터가 유효성 검사기에 표시되지 않았습니다.

고급 교육 설정을 적용하는 경우 열을 교체해야 하며 모든 열 값이 올바르게 매핑되어야 합니다. 결과적으로 데이터가 별도의 열로 올바르게 추출됩니다. 모든 열 셀을 다시 매핑하거나 처음 두 행은 그대로 유지하면서 다른 모든 잘못된 셀 행을 제거하도록 선택할 수 있습니다. 열에 잘못된 셀이 없어야 하며 모든 열 셀에 올바른 값이 있어야 합니다.

이전에는 이러한 경우 두 열의 데이터를 하나의 열로 추출했습니다.

이제 테이블 필드 값을 올바른 순서로 추출할 수 있으며 다중 행 추출 문제가 더 이상 지속되지 않습니다. 또한 테이블에 행이 하나만 있는 경우 테이블 끝 표시기 기능을 사용하여 피드백 데이터를 적용한 후 여러 줄을 추출할 수 있습니다.
주: 단일 행 테이블의 경우 테이블 끝 표시기 기능을 사용하는 방법이 가장 좋습니다. 그렇지 않으면 특정 시나리오에서 추출이 부분적으로 이루어질 수 있습니다.

서비스 클라우드 케이스 ID: 02091013

문서를 학습한 후 사용자가 Google Vision OCR(으)로 동일한 문서를 처리하면 피드백이 저장되고 필요한 데이터가 추출됩니다.

이전에는 이러한 경우 특정 유형의 문서를 처리할 수 없었고 매번 수동으로 문서의 유효성을 검사해야 했습니다.

서비스 클라우드 케이스 ID: 02098682

3.31.17

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
Google Vision OCR을 사용하면 Google Document AI 라이선스 없이도 문서를 성공적으로 처리할 수 있습니다. 또한 오류 메시지를 생성하지 않습니다.

이전에는 문서를 처리하기 위해 Google Document AI 라이선스를 요청하고 문서를 추출하는 동안 오류가 발생했습니다. 따라서 대기열을 사용하여 Google Vision OCR을 배포할 수 없었습니다.

서비스 클라우드 케이스 ID: 02097428, 02096992, 02097798, 02097157, 02098378, 02098563, 02094573

3.31.16

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
사용자가 Google Document AI (BYOK) 및 인증된 프록시를 사용하여 학습 인스턴스를 만들면 더 이상 10페이지가 넘는 문서에서 문서 추출이 실패하지 않습니다.

이전에는 이러한 경우 오류 메시지와 함께 추출이 실패하여 사용자가 문서를 처리할 수 없었습니다.

3.31.15

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
문서 규칙에 그룹을 포함하거나 포함하지 않는 AND 연산자를 사용하는 여러 조건이 포함되어 있는 경우 이제 적절한 오류 메시지가 표시됩니다. 또한 이제 필드에 해당 작업이 적용됩니다.

3.31.13

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
변경된 부분
Document Automation에서 향상된 비정형 문서 추출 기능을 사용하면 다음을 수행할 수 있습니다.
  • 복잡한 쿼리를 효과적으로 처리합니다.
  • 관련 페이지에 대한 개선된 탐색 기능으로 문서의 유효성을 검사합니다.
버그 패치
ABBYY OCR 엔진을 사용하여 테이블 추출이 개선되면서 이제 휴리스틱 피드백이 올바르게 작동합니다.
  • 독일어의 경우 피드백을 적용한 후 송장 추출이 올바르게 작동하고 모든 테이블 데이터가 추출됩니다.
  • 스페인어의 경우 송장 문서에서 테이블 데이터가 올바르게 추출됩니다.
  • 영어의 경우 ABBYY OCR을 사용하여 모든 페이지에서 송장 데이터를 추출합니다.

서비스 클라우드 케이스 ID: 01995901

휴리스틱 피드백을 적용한 후 사용자가 테이블이 여러 페이지로 확장된 PDF 파일에서 테이블 데이터를 추출하면 모든 페이지의 데이터가 성공적으로 추출됩니다.

이전에는 테이블이 여러 페이지로 확장된 PDF 파일의 두 번째 페이지에서 데이터를 추출할 수 없었습니다.

서비스 클라우드 케이스 ID: 01996536

이제 모든 필드의 첫 페이지에서 추출을 시작하면 경험적 피드백이 여러 줄 테이블 데이터 캡처에 대해 제대로 작동하고 올바른 출력을 생성합니다.

이전에는 휴리스틱 피드백을 제공한 후에도 여러 줄의 테이블 데이터가 추출되지 않았습니다. 그리고 출력이 제대로 생성되지 않았습니다.

서비스 클라우드 케이스 ID: 01944805, 01946809, 01952836, 01957090, 01975800, 01981088, 01944805, 01946809, 01952836, 01957090

Microsoft 표준 양식의 경우 셀이 비어 있어도 더 이상 테이블 추출이 실패하지 않으며 사용자가 문서를 성공적으로 추출할 수 있습니다.
사용자가 학습 인스턴스를 가져와서 문서를 처리하면, 추출된 문서의 모든 페이지에 날짜에 대한 올바른 단어 순서가 표시됩니다.
사용자가 학습 인스턴스를 가져와서 문서를 처리하면 추출 후 모든 값이 테이블에 표시됩니다.

이전에는 시스템 식별 영역(SIR)이 강조 표시되었지만 테이블에 빈 값이 표시되었습니다.

사용자가 휴리스틱 피드백이 포함된 .dw 파일을 가져와서 마지막 행에 (-) 값이 포함된 문서를 처리하면 마지막 행의 음수 값을 건너뛰지 않고 올바르게 문서를 추출할 수 있습니다.

이전에는 이러한 경우 마지막 행을 건너뛰어 데이터가 손실되거나 잘못된 처리가 발생했습니다.

사용자가 테이블이 포함된 문서를 처리할 때 DOCUMENT_PARTIALLY_FAILED 또는 Extraction Timeout 오류 메시지 없이 추출이 성공적으로 완료됩니다.

이전에는 이러한 경우 동일한 테이블에서 여러 문서가 감지되어 일부 문서가 추출되지 않았기 때문에 테이블 크기(최대 () 인수) 문제가 발생했습니다.

사용자가 학습 인스턴스를 가져와서 문서를 처리하면 모든 페이지에서 모든 행이 개별적으로 추출됩니다.

이전에는 두 번째 페이지의 행이 하나의 행으로 병합되었습니다.

제한 사항
사용자가 Google Vision OCR을(를) 사용하면 테이블 감지 또는 추출이 작동하지 않습니다.

해결 방법: ABBYY OCR 엔진을 사용하는 것이 좋습니다.

서비스 클라우드 케이스 ID: 01995901

테이블이 모든 페이지에서 헤더 없이 여러 페이지에 걸쳐 있는 경우(헤더가 없는 페이지), 사용자는 피드백을 적용한 후 모든 페이지에서 데이터가 추출되지 않는 현상을 관찰할 수 있습니다.

3.30.24

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
이제 사용자가 휴리스틱 피드백을 사용하여 두 번째 행에서 추출된 데이터를 올바르게 확인할 수 있습니다.
구매 주문 문서 유형의 경우, 이제 모든 페이지에서 테이블 필드 값을 올바르게 추출할 수 있습니다.
이제 생성된 피드백 파일에 오류 메시지가 표시되지 않으며 사용자가 문서를 성공적으로 처리할 수 있습니다.

3.30.22

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
새로운 기능
Document Automation에서 새 문서 데이터 가져오기문서 데이터 업데이트 작업을 통해 향상된 추출 기능을 제공합니다. 이러한 작업을 사용하여 데이터 조작 및 유효성 검사를 위한 사용자 정의 로직을 적용하여 STP(일괄 자동 처리)를 극대화하고 수동 유효성 검사 작업을 줄일 수 있습니다.

3.30.21

  • 호환되는 Bot 에이전트 버전: 21.98 이상
  • 호환되는 Control Room 버전: 15345 이상
버그 패치
문서 추출 패키지 릴리스는 일부 문서 처리 시 발생하는 '501: DOCUMENT_PARTIALLY_FAILED' 오류를 수정하기 위한 패치입니다.

3.30.19

  • 호환되는 Bot 에이전트 버전: 21.98 이상
  • 호환되는 Control Room 버전: 15345 이상
버그 패치
문서 추출 패키지는 복잡한 테이블 헤더 열을 위해 향상된 추출 기능을 제공합니다.
  • 시나리오 1: 여러 헤더가 단일 열로 병합된 테이블 열 헤더에서 데이터를 추출하기.
  • 시나리오 2: 여러 개로 분할된 하위 헤더가 있는 테이블 열 헤더에서 데이터 추출하기.
향상된 테이블 헤더 데이터 추출을 사용하려면 다음 단계를 수행합니다.
  1. 학습 인스턴스를 생성하거나 편집합니다.
  2. 테이블 필드를 추가하거나 편집하려면, 테이블 필드 탭으로 이동하여 필드 추가 > 필드 속성을 클릭합니다.
  3. 각 테이블 헤더를 별도의 테이블 필드로 추가합니다. 예시:

    시나리오 1: 열 헤더와 병합된 각 하위 헤더를 별도의 테이블 필드로 추가합니다. 스크린샷을 참조로 사용하여 병합된 세 개의 열 헤더 필드에서 데이터를 추출하고, 별칭 CGST가 있는 CGST, 별칭 SGST가 있는 SGST, 별칭 CESS가 있는 CESS와 같은 세 개의 별도 테이블 필드를 생성합니다.

    여러 개의 하위 헤더가 있는 열 헤더의 예.

    시나리오 2: 열 헤더와 분할된 각 하위 헤더를 별도의 테이블 필드로 추가합니다. 위의 예와 마찬가지로 분할된 하위 헤더 Rate 및 AMT가 있는 열 헤더 CGST의 경우, 별칭 CGST Rate가 있는 CGST Rate와 별칭 CGST AMT가 있는 CGST AMT라는 두 개의 별도 테이블 필드를 생성해야 합니다.

    여러 개의 분할된 하위 헤더가 있는 열 헤더의 예.

  4. 제출을 클릭하여 업데이트를 저장합니다.

3.29.17

  • 호환되는 Bot 에이전트 버전: 21.98 이상
  • 호환되는 Control Room 버전: 15345 이상
버그 패치
문서 추출 패키지에는 양식 및 테이블 필드 모두에 대한 추출 개선 사항이 포함되어 있습니다.

3.29.14

  • 호환되는 Bot 에이전트 버전: 21.98 이상
  • 호환되는 Control Room 버전: 15345 이상
새로운 기능
Document Automation은 다중 테이블과 같은 복잡한 시나리오에 중점을 둔 휴리스틱 피드백을 통해 향상된 추출을 제공합니다. 또한 양식 필드와 기본 제공 성능(특히 테이블 필드의 경우) 모두에 대한 추출 개선 사항이 있습니다.