문서 추출 패키지 업데이트

새로운 기능과 향상된 기능, 수정 사항 및 제한 사항 등 릴리스된 문서 추출 패키지 버전의 업데이트를 확인해 보십시오. 이 페이지에는 각 버전의 릴리스 날짜와 호환 가능한 Control RoomBot 에이전트 버전도 나열되어 있습니다.

버전 요약

다음 테이블에는 Automation 360 릴리스 또는 패키지 전용 릴리스로 릴리스된 문서 추출 패키지 버전이 나열되어 있습니다(릴리스 날짜의 내림차순). 해당 패키지 버전의 업데이트에 대한 정보를 보려면 버전 링크를 클릭하십시오.
버전 릴리스 날짜 릴리스 유형 Bot 에이전트 버전 Control Room 빌드
문서 추출 패키지 업데이트 2024년 7월 15일 패키지 전용, Automation 360 v.33 릴리스 후 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2024년 6월 14일 패키지 전용, Automation 360 v.32 릴리스 후 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2024년 6월 26일 Automation 360 v.33(온프레미스) 릴리스 포함 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2024년 4월 18일 패키지 전용, Automation 360 v.32 릴리스 후 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2024년 4월 5일 Automation 360 v.32(온프레미스) 릴리스 포함 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2024년 3월 21일 Automation 360 v.32(샌드박스) 릴리스 포함 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2024년 1월 26일 패키지 전용, Automation 360 v.31 릴리스 후 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2023년 12월 22일 패키지 전용, Automation 360 v.31(샌드박스) 릴리스 후 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2023년 12월 6일 Automation 360 v.31(샌드박스) 릴리스 포함 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2023년 11월 28일 Automation 360 v.30 릴리스 포함 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2023년 11월 16일 패키지 전용, Automation 360 v.30 릴리스 후 21.252 이상 19223 이상
3.30.24 2023년 9월 21일 패키지 전용, Automation 360 v.30(샌드박스) 릴리스 후 21.252 이상 19223 이상
3.30.22 2023년 9월 6일 Automation 360 v.30(샌드박스) 릴리스 포함 21.252 이상 19223 이상
문서 추출 패키지 업데이트 2023년 8월 21일 패키지-전용, Automation 360 v.29 이후 21.98 이상 15345 이상
3.30.19 2023년 8월 16일 패키지-전용, Automation 360 v.29 이후 21.98 이상 15345 이상
문서 추출 패키지 업데이트 2023년 7월 17일 패키지 전용, Automation 360 v.29 릴리스 후 21.98 이상 15345 이상
문서 추출 패키지 업데이트 2023년 6월 6일 Automation 360 v.29(샌드박스) 릴리스 포함 21.98 이상 15345 이상
주:
  • 개별 패키지(Automation 360 릴리스에서 패키지만 원하는 경우 업데이트됨)를 다운로드하려면 이 URL을 사용합니다.

    https://aai-artifacts.my.automationanywhere.digital/packages/<package-file-name>-<version.number>.jar

  • 문서 추출 패키지의 경우 명명 규칙은 다음과 같습니다. bot-command-iqbot-extraction360-<version-number>-full.jar

    예: bot-command-iqbot-extraction360-3.31.22-full.jar

패키지를 다운로드하고 Control Room에 수동으로 추가하는 자세한 단계는 Control Room에 패키지 추가 항목을 참조하십시오.

미정

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
마이그레이션된 학습 인스턴스를 사용하여 문서를 처리할 때 문서가 유효성 검사기로 이동되면 이제 유효성 검사 피드백이 기본 엔진에서 추출한 필드 값을 덮어쓸 수 있으며 해당 필드 값에 대한 데이터가 추출되지 않은 경우 파일 값을 업데이트하지 않습니다.

이전에는 이러한 시나리오에서 유효성 검사 피드백이 필드 값을 덮어쓸 수 없었고, 특정 필드 값에 대해 추출된 데이터가 비어 있음에도 불구하고 데이터가 업데이트되었습니다.

마이그레이션된 학습 인스턴스를 사용하여 문서를 처리할 때 문서가 유효성 검사기로 이동되면 이제 유효성 검사 피드백이 기본 엔진에서 추출된 필드 값을 덮어쓸 수 있습니다.

이전에는 이러한 시나리오에서 유효성 검사 피드백이 필드 값을 덮어쓸 수 없었습니다.

이제 양식 필드에서 데이터를 추출할 때 모든 양식 필드의 데이터가 추출됩니다.

이전에는 일부 양식 필드에서 데이터를 추출할 수 없었습니다.

서비스 클라우드 케이스 ID: 02124062

유효성 검사 규칙을 사용하는 마이그레이션된 학습 인스턴스에서 문서를 처리할 때, 이제 유효성 검사 규칙에 따라 올바른 값이 추출되면 유효성 검사 없이도 문서가 올바르게 처리됩니다.

이전에는 일부 시나리오에서 올바른 값이 추출되었음에도 불구하고 문서가 유효성 검사를 위해 전송되었습니다.

이제 생성형 AI 공급자를 사용하여 여러 페이지에 걸쳐 있는 테이블에서 데이터를 추출할 수 있습니다.

이전에는 일부 시나리오에서 일부 페이지에 대한 데이터 추출이 누락되었습니다.

3.33.13

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
변경된 부분
테이블 추출 모델 개선(서비스 클라우드 케이스 ID: 02122434)

테이블 구조 추출 및 오류 처리를 개선하기 위해 테이블 추출 모델이 업데이트되었습니다.

버그 패치
이제 학습 인스턴스의 표준 vendor_name 양식 필드에 유효성 검사 피드백을 제공하여 공급업체 이름을 성공적으로 추출할 수 있습니다.

이전에는 이러한 경우 오류가 발생했습니다.

서비스 클라우드 케이스 ID: 02124772, 02122434, 02126627, 02129868, 02132605

여러 페이지와 테이블이 포함된 문서의 경우 유효성 검사기의 고급 교육 설정에서 모든 테이블의 기본 열 및 테이블 끝 표시기 필드가 유효성 검사 피드백을 제공한 후 적절하게 업데이트됩니다.

이전에는 모든 테이블에 대해 기본 열 및 테이블 끝 표시기 필드가 업데이트되지 않았습니다.

이제 학습 인스턴스가 있는 다중 테이블이 포함된 문서를 처리할 때 유효성 검사 피드백이 다중 테이블에 대해 작동합니다.
제한
다음 시나리오에서는 데이터 추출이 실패합니다.
  • 문서 유형이 비정형 문서로 설정되고 언어가 스웨덴어로 설정된 학습 인스턴스를 만들었습니다.
  • 학습 인스턴스에 대한 추출 bot은 문서 추출 패키지 버전 3.33.13을 사용하고 있습니다.

3.33.11

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
이제 다음의 경우 학습 인스턴스를 사용하여 문서를 처리할 수 있습니다.
  • 학습 인스턴스는 IQ Bot에서 확인란 필드를 사용하여 생성되었습니다.
  • 학습 인스턴스는 IQ Bot - Document Automation 브리지 패키지를 사용하여 Document Automation로 가져와집니다.
  • Document Automation에서 학습 인스턴스에 대해 유효성 검사를 사용하여 정확도 향상 옵션이 활성화됩니다.

이전에는 이러한 경우 데이터 추출이 실패했습니다.

3.32.26

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
Google Document AI로 문서를 처리하면 추출 bot이 이제 포르투갈 언어에 대해 성공적으로 수행되고 해당 문서를 유효성 검사기로 보냅니다.

손글씨 또는 서명 객체가 있는 문서를 처리할 때 이제 이러한 객체가 최종 출력 JSON 파일에 포함됩니다.

이전에는 서명에 대해 설정된 높은 신뢰도 임계값으로 인해 필기 또는 서명 객체가 최종 출력 JSON 파일에 포함되지 않았습니다.

BYOK(Bring Your Own Key) 설정으로 Google CDE(Custom Document Extractor)를 사용해 문서를 처리하며 해당 프로세서가 기본 모델을 사용하는 경우, 변환 실패로 인해 더 이상 문서를 처리하지 못합니다.
복잡한 테이블 열 감지를 위해 특별히 개선된 테이블 구조 모델을 통해 이제 더 정확한 추출 결과를 얻을 수 있습니다.

서비스 클라우드 케이스 ID: 02110860

IQ Bot에서 Document Automation으로 연결된 학습 인스턴스의 경우, 유효성 검사 피드백이 활성화되고 유효성 검사 피드백이 적용된 후 사용자가 다음 문서를 처리하면 이제 병합된 행 없이 모든 페이지의 데이터가 성공적으로 추출됩니다.

3.32.23

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
보안 스캔에서 보고된 취약점 수정됨

3.32.22

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
이제 테이블 끝 표시기가 추가되어 향상된 문서 테이블 감지 모델을 통해 모든 페이지의 테이블 데이터에서 선택한 언어의 데이터를 추출할 수 있습니다. 따라서 페이지에서 누락된 테이블과 마지막 행 추출 문제를 줄일 수 있습니다.

서비스 클라우드 케이스 ID: 02065073

테이블 추출 기능이 개선되어 비정형 테이블에 더 이상 정크 값이 표시되지 않으며 테이블 데이터가 성공적으로 추출됩니다.
이제 사용자는 Bot 에이전트 머신에서 프록시가 활성화된 경우 Document Automation 환경에서 유효성 검사 피드백을 저장할 수 있습니다.

서비스 클라우드 케이스 ID: 02092484

Google Vision OCR 및 프록시를 활성화하면 더 이상 비정형 문서에 대해 문서 추출이 실패하지 않으며 오류 메시지가 표시되지 않습니다.

서비스 클라우드 케이스 ID: 02104409

3.31.22

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
학습 인스턴스에 유효성 검사 피드백을 추가하면 더 이상 오류 메시지와 함께 문서 추출이 실패하지 않습니다.

이전에는 유효성 검사 확인란을 선택하면 문서 추출이 실패했습니다.

학습 인스턴스에 유효성 검사 피드백을 추가하면 문서의 모든 페이지에 있는 모든 테이블에 대한 피드백이 저장되고 모든 페이지에서 데이터가 올바르게 추출됩니다.

이전에는 모든 페이지에 대한 피드백이 저장되지 않았습니다.

서비스 클라우드 케이스 ID: 01995135, 02093575, 02093389

유효성 검사 피드백을 추가한 후 테이블 ID가 일치하면 이제 모든 페이지의 모든 테이블에서 데이터가 추출되어 유효성 검사기에 표시됩니다.

이전에는 이러한 경우 일부 페이지를 건너뛰고 모든 페이지의 데이터가 유효성 검사기에 표시되지 않았습니다.

고급 교육 설정을 적용하는 경우 열을 교체해야 하며 모든 열 값이 올바르게 매핑되어야 합니다. 결과적으로 데이터가 별도의 열로 올바르게 추출됩니다. 모든 열 셀을 다시 매핑하거나 처음 두 행은 그대로 유지하면서 다른 모든 잘못된 셀 행을 제거하도록 선택할 수 있습니다. 열에 잘못된 셀이 없어야 하며 모든 열 셀에 올바른 값이 있어야 합니다.

이전에는 이러한 경우 두 열의 데이터를 하나의 열로 추출했습니다.

이제 테이블 필드 값을 올바른 순서로 추출할 수 있으며 다중 행 추출 문제가 더 이상 지속되지 않습니다. 또한 테이블에 행이 하나만 있는 경우 테이블 끝 표시기 기능을 사용하여 피드백 데이터를 적용한 후 여러 줄을 추출할 수 있습니다.
주: 단일 행 테이블의 경우 테이블 끝 표시기 기능을 사용하는 방법이 가장 좋습니다. 그렇지 않으면 특정 시나리오에서 추출이 부분적으로 이루어질 수 있습니다.

서비스 클라우드 케이스 ID: 02091013

문서를 학습한 후 사용자가 Google Vision OCR(으)로 동일한 문서를 처리하면 피드백이 저장되고 필요한 데이터가 추출됩니다.

이전에는 이러한 경우 특정 유형의 문서를 처리할 수 없었고 매번 수동으로 문서의 유효성을 검사해야 했습니다.

서비스 클라우드 케이스 ID: 02098682

3.31.17

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
Google Vision OCR을 사용하면 Google Document AI 라이선스 없이도 문서를 성공적으로 처리할 수 있습니다. 또한 오류 메시지를 생성하지 않습니다.

이전에는 문서를 처리하기 위해 Google Document AI 라이선스를 요청하고 문서를 추출하는 동안 오류가 발생했습니다. 따라서 대기열을 사용하여 Google Vision OCR을 배포할 수 없었습니다.

서비스 클라우드 케이스 ID: 02097428, 02096992, 02097798, 02097157, 02098378, 02098563, 02094573

3.31.16

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
사용자가 Google Document AI (BYOK) 및 인증된 프록시를 사용하여 학습 인스턴스를 만들면 더 이상 10페이지가 넘는 문서에서 문서 추출이 실패하지 않습니다.

이전에는 이러한 경우 오류 메시지와 함께 추출이 실패하여 사용자가 문서를 처리할 수 없었습니다.

3.31.15

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
문서 규칙에 그룹을 포함하거나 포함하지 않는 AND 연산자를 사용하는 여러 조건이 포함되어 있는 경우 이제 적절한 오류 메시지가 표시됩니다. 또한 이제 필드에 해당 작업이 적용됩니다.

3.31.13

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
변경된 부분
Document Automation에서 향상된 비정형 문서 추출 기능을 사용하면 다음을 수행할 수 있습니다.
  • 복잡한 쿼리를 효과적으로 처리합니다.
  • 관련 페이지에 대한 개선된 탐색 기능으로 문서의 유효성을 검사합니다.
버그 패치
ABBYY OCR 엔진을 사용하여 테이블 추출이 개선되면서 이제 휴리스틱 피드백이 올바르게 작동합니다.
  • 독일어의 경우 피드백을 적용한 후 송장 추출이 올바르게 작동하고 모든 테이블 데이터가 추출됩니다.
  • 스페인어의 경우 송장 문서에서 테이블 데이터가 올바르게 추출됩니다.
  • 영어의 경우 ABBYY OCR을 사용하여 모든 페이지에서 송장 데이터를 추출합니다.

서비스 클라우드 케이스 ID: 01995901

휴리스틱 피드백을 적용한 후 사용자가 테이블이 여러 페이지로 확장된 PDF 파일에서 테이블 데이터를 추출하면 모든 페이지의 데이터가 성공적으로 추출됩니다.

이전에는 테이블이 여러 페이지로 확장된 PDF 파일의 두 번째 페이지에서 데이터를 추출할 수 없었습니다.

서비스 클라우드 케이스 ID: 01996536

이제 모든 필드의 첫 페이지에서 추출을 시작하면 경험적 피드백이 여러 줄 테이블 데이터 캡처에 대해 제대로 작동하고 올바른 출력을 생성합니다.

이전에는 휴리스틱 피드백을 제공한 후에도 여러 줄의 테이블 데이터가 추출되지 않았습니다. 그리고 출력이 제대로 생성되지 않았습니다.

서비스 클라우드 케이스 ID: 01944805, 01946809, 01952836, 01957090, 01975800, 01981088, 01944805, 01946809, 01952836, 01957090

Microsoft 표준 양식의 경우 셀이 비어 있어도 더 이상 테이블 추출이 실패하지 않으며 사용자가 문서를 성공적으로 추출할 수 있습니다.
사용자가 학습 인스턴스를 가져와서 문서를 처리하면, 추출된 문서의 모든 페이지에 날짜에 대한 올바른 단어 순서가 표시됩니다.
사용자가 학습 인스턴스를 가져와서 문서를 처리하면 추출 후 모든 값이 테이블에 표시됩니다.

이전에는 SIR(시스템 식별 영역)이 강조 표시되었지만 테이블에 빈 값이 표시되었습니다.

사용자가 휴리스틱 피드백이 포함된 .dw 파일을 가져와서 마지막 행에 (-) 값이 포함된 문서를 처리하면 마지막 행의 음수 값을 건너뛰지 않고 올바르게 문서를 추출할 수 있습니다.

이전에는 이러한 경우 마지막 행을 건너뛰어 데이터가 손실되거나 잘못된 처리가 발생했습니다.

사용자가 테이블이 포함된 문서를 처리할 때 DOCUMENT_PARTIALLY_FAILED 또는 Extraction Timeout 오류 메시지 없이 추출이 성공적으로 완료됩니다.

이전에는 이러한 경우 동일한 테이블에서 여러 문서가 감지되어 일부 문서가 추출되지 않았기 때문에 테이블 크기(최대 () 인수) 문제가 발생했습니다.

사용자가 학습 인스턴스를 가져와서 문서를 처리하면 모든 페이지에서 모든 행이 개별적으로 추출됩니다.

이전에는 두 번째 페이지의 행이 하나의 행으로 병합되었습니다.

제한 사항
사용자가 Google Vision OCR을(를) 사용하면 테이블 감지 또는 추출이 작동하지 않습니다.

해결 방법: ABBYY OCR 엔진을 사용하는 것이 좋습니다.

서비스 클라우드 케이스 ID: 01995901

테이블이 모든 페이지에서 헤더 없이 여러 페이지에 걸쳐 있는 경우(헤더가 없는 페이지), 사용자는 피드백을 적용한 후 모든 페이지에서 데이터가 추출되지 않는 현상을 관찰할 수 있습니다.

3.30.24

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
버그 패치
이제 사용자가 휴리스틱 피드백을 사용하여 두 번째 행에서 추출된 데이터를 올바르게 확인할 수 있습니다.
구매 주문 문서 유형의 경우, 이제 모든 페이지에서 테이블 필드 값을 올바르게 추출할 수 있습니다.
이제 생성된 피드백 파일에 오류 메시지가 표시되지 않으며 사용자가 문서를 성공적으로 처리할 수 있습니다.

3.30.22

  • 호환되는 Bot 에이전트 버전: 21.252 이상
  • 호환되는 Control Room 버전: 19223 이상
새로운 기능
Document Automation에서 새 문서 데이터 가져오기문서 데이터 업데이트 작업을 통해 향상된 추출 기능을 제공합니다. 이러한 작업을 사용하여 데이터 조작 및 유효성 검사를 위한 사용자 정의 로직을 적용하여 수동 유효성 검사 작업을 줄일 수 있습니다.

3.30.21

  • 호환되는 Bot 에이전트 버전: 21.98 이상
  • 호환되는 Control Room 버전: 15345 이상
버그 패치
문서 추출 패키지 릴리스는 일부 문서 처리 시 발생하는 '501: DOCUMENT_PARTIALLY_FAILED' 오류를 수정하기 위한 패치입니다.

3.30.19

  • 호환되는 Bot 에이전트 버전: 21.98 이상
  • 호환되는 Control Room 버전: 15345 이상
버그 패치
문서 추출 패키지는 복잡한 테이블 헤더 열을 위해 향상된 추출 기능을 제공합니다.
  • 시나리오 1: 여러 헤더가 단일 열로 병합된 테이블 열 헤더에서 데이터를 추출하기.
  • 시나리오 2: 여러 개로 분할된 하위 헤더가 있는 테이블 열 헤더에서 데이터 추출하기.
향상된 테이블 헤더 데이터 추출을 사용하려면 다음 단계를 수행합니다.
  1. 학습 인스턴스를 생성하거나 편집합니다.
  2. 테이블 필드를 추가하거나 편집하려면, 테이블 필드 탭으로 이동하여 필드 추가 > 필드 속성을 클릭합니다.
  3. 각 테이블 헤더를 별도의 테이블 필드로 추가합니다. 예시:

    시나리오 1: 열 헤더와 병합된 각 하위 헤더를 별도의 테이블 필드로 추가합니다. 스크린샷을 참조로 사용하여 병합된 세 개의 열 헤더 필드에서 데이터를 추출하고, 별칭 CGST가 있는 CGST, 별칭 SGST가 있는 SGST, 별칭 CESS가 있는 CESS와 같은 세 개의 별도 테이블 필드를 생성합니다.

    여러 개의 하위 헤더가 있는 열 헤더의 예.

    시나리오 2: 열 헤더와 분할된 각 하위 헤더를 별도의 테이블 필드로 추가합니다. 위의 예와 마찬가지로 분할된 하위 헤더 Rate 및 AMT가 있는 열 헤더 CGST의 경우, 별칭 CGST Rate가 있는 CGST Rate와 별칭 CGST AMT가 있는 CGST AMT라는 두 개의 별도 테이블 필드를 생성해야 합니다.

    여러 개의 분할된 하위 헤더가 있는 열 헤더의 예.

  4. 제출을 클릭하여 업데이트를 저장합니다.

3.29.17

  • 호환되는 Bot 에이전트 버전: 21.98 이상
  • 호환되는 Control Room 버전: 15345 이상
버그 패치
문서 추출 패키지에는 양식 및 테이블 필드 모두에 대한 추출 개선 사항이 포함되어 있습니다.

3.29.14

  • 호환되는 Bot 에이전트 버전: 21.98 이상
  • 호환되는 Control Room 버전: 15345 이상
새로운 기능
Document Automation은 다중 테이블과 같은 복잡한 시나리오에 중점을 둔 휴리스틱 피드백을 통해 향상된 추출을 제공합니다. 또한 양식 필드와 기본 제공 성능(특히 테이블 필드의 경우) 모두에 대한 추출 개선 사항이 있습니다.