테이블 데이터 추출 개선

고급 교육 설정을 사용하여 문서를 훈련하고 Document Automation 추출 엔진에 추가 입력을 제공하여 테이블 데이터 추출을 개선하십시오.

문서를 추출한 후 유효성 검사 페이지의 고급 교육 설정 옵션을 사용하여 다음 값을 설정할 수 있습니다.
  • 기본 열: 요구 사항에 따라 행 식별을 위한 기본 열을 설정합니다.
  • 테이블/섹션 끝 표시기 테이블 끝 표시기 값을 추가하여 시스템에서 테이블 끝 표시기 값을 제외하고 지정된 값에 도달할 때까지 데이터를 추출하도록 합니다.
  • 헤더 라벨: 필요에 따라 테이블 필드를 조정하거나 다시 매핑할 수 있습니다.
주: 이 기능은 유효성 검사를 사용하여 정확도 향상 옵션을 사용할 수 있는 경우에만 제공업체에 적용할 수 있습니다.

전제 조건

  • 고급 교육 설정 옵션은 유효성 검사를 사용하여 정확도 향상 옵션이 활성화된 경우에만 사용할 수 있습니다.
  • 헤더 라벨, 테이블 끝 표시기 및 행 감지에 사용되는 기본 열에 대한 정보를 제공할 수 있는 그룹 교육 권한이 있는지 확인하십시오.
  • 기본 열은 하나만 있을 수 있습니다.
  • 테이블 끝 표시기는 텍스트 SIR(시스템 식별 영역)입니다.

프로시저

  1. 문서를 처리하고 유효성 검사 페이지로 이동합니다.
  2. 고급 교육 설정을 클릭합니다.

    유효성 검사기 페이지의 고급 교육 설정 옵션
  3. 문서에 다음 값을 설정하도록 훈련하십시오.
    1. 행 식별을 위한 사용자 정의 기본 열을 설정합니다.

      고급 교육 설정을 사용하여 기본 열 설정

      이 값을 처음 지정할 때, 다음에 이 문서나 유사한 유형의 문서를 다시 처리할 때 이 값이 자동으로 업데이트됩니다.

      자동으로 업데이트된 값을 지우려면 드롭다운 메뉴를 클릭하고 드롭다운 메뉴에서 비어 있는 값을 선택합니다.

    2. 테이블 끝 표시기 값을 지정합니다.

      EoT 텍스트를 제외한 데이터 추출을 위한 테이블 끝 표시기 지정하기
      주: 테이블이 여러 페이지에 걸쳐 있고 각 페이지에 유사한 테이블 끝 필드가 포함되어 있는 경우, 테이블 끝 표시기를 추가하는 것이 좋습니다. 테이블 끝 표시기를 추가하면 시스템이 각 페이지에서 표시기를 평가하므로 테이블의 데이터 추출이 개선됩니다.

      이 값을 처음 지정하는 경우 다음에 이 문서를 다시 처리하거나 유사한 유형의 문서를 처리할 때, 이 값은 문서의 임의 위치에 표시기가 있어도 자동으로 업데이트됩니다.

      문서에 이 값이 없어도 자동으로 업데이트됩니다. 그러나 값이 누락되어 문서에 해당하는 SIR(시스템 식별 지역)이 없습니다.

      자동으로 업데이트된 값을 지우려면 테이블 끝 표시기 필드에 있는 값 옆에 있는 닫기 버튼을 클릭하거나 문서에서 해당 값의 선택 상자에서 닫기 버튼을 클릭합니다.

    3. 필수 열을 클릭하고 필요한 헤더 이름을 지정합니다.

      열의 헤더 값 변경
  4. 제출을 클릭하고 문서를 다시 처리합니다.
    주: 문서를 다시 처리하는 동안 이러한 설정을 저장하고 적용하려면 제출을 클릭해야 합니다.
    지정된 고급 교육 설정에 따라 문서가 재처리된 후 유효성 검사기로 다시 전송되어 필드의 유효성을 검사하거나 성공 폴더에 있는 데이터를 CSV 파일로 추출합니다.

기본 열

예를 들어, 문서를 추출한 후 항목 번호 열의 여러 줄 테이블 데이터가 단일 행으로 추출되지만 이를 별도의 행으로 추출하려고 합니다. 이러한 경우 항목 번호를 기본 열로 설정하여 테이블 추출을 개선할 수 있습니다. 자세한 내용은 고급 교육 설정을 사용하여 기본 열을 설정하는 예를 참조하십시오.

테이블 끝 표시기

예를 들어, 문서를 처리할 때 전체 테이블 데이터를 추출하는 반면, 총 지불액까지 행 데이터를 추출하려는 경우 전체 테이블 데이터를 추출합니다. 이러한 경우 테이블 끝 표시기 값을 지정하면 해당 값( 테이블 끝 표시기 값 제외)까지의 테이블 데이터만 추출되고 더 이상의 행 데이터는 추출되지 않도록 할 수 있습니다.

헤더 라벨

테이블 데이터에 라벨이 일치하지 않는 경우(예: 추출된 헤더 라벨은 단위 가격이지만 헤더 라벨을 가격으로 지정하고 싶은 경우). 이러한 경우 헤더 라벨을 변경할 수 있습니다.

또 다른 유스케이스는 단가의 모든 값을 다시 매핑하거나 열 데이터와 함께 헤더 라벨을 변경할 수 있다는 것입니다. 자동 채우기를 사용하여 이 재매핑을 신속하게 진행할 수 있습니다. 예를 들어, 추출 후 학습 인스턴스의 가격 열은 확장 가격으로 추출되지만, 해당 열 데이터와 함께 헤더 라벨을 단위 가격으로 지정하고 싶을 수 있습니다. 이러한 케이스에 확장 가격 헤더 라벨을 단가로 변경할 수 있으며 단가 열에서 모든 셀 값을 선택하여 다시 매핑해야 합니다.


열 데이터와 함께 필요한 헤더를 가져오도록 헤더 라벨 변경하기
다음 동영상에서 항목 번호를 기본 열로 설정하고 단일 셀이 아닌 별도의 행으로 데이터를 추출하는 예시를 확인할 수 있습니다.