문서 분류 개요
- 최종 업데이트2024/12/16
문서 분류 개요
문서 분류는 분류기 패키지를 사용하여 문서나 문서 내의 페이지를 레이아웃, 내용 또는 둘 다와 같은 속성을 기준으로 여러 범주로 그룹화하거나 분류하는 자동화된 프로세스입니다.
이 프로세스는 문서를 정리한 다음 문서 처리를 실행해야 하는 시나리오에서 사용할 수 있습니다. 예를 들어, 문서 분류 프로세스가 완료된 후 적절한 학습 인스턴스에서 해당 문서를 처리할 수 있습니다.
분류가 작동하는 방식
문서 분류를 통해 다음과 같은 방식으로 문서를 처리할 수 있습니다.
- 문서 정리
- 파일에 수많은 문서가 포함되어 있는 경우, 문서 분류를 통해 해당 문서를 관련 범주로 분류하여 이러한 문서를 쉽게 관리하고 검색할 수 있습니다. 이러한 파일에는 동일한 유형의 문서(예: 송장)가 있을 수도 있고 다른 유형(예: 송장, 선하증권, 구매 주문서)의 문서가 있을 수도 있습니다.
- 워크플로 간소화
- 분류기가 올바른 문서를 식별하면 분류된 문서를 올바른 문서 처리 워크플로에 사용할 수 있으며, 이를 통해 문서 식별과 데이터 추출의 정확성이 향상됩니다. 예를 들어, 데이터 추출을 위해 적절한 학습 인스턴스에서 문서를 처리할 수 있습니다.
- 효율성 향상
- 문서 분류는 문서를 분류하고 정리하는 데 소요되는 수작업을 줄여 시간을 절약하고 수작업 오류를 최소화합니다.
분류기 유형
개별 유스케이스나 비즈니스 요구 사항에 따라 다음 분류 옵션 중 하나를 선택할 수 있습니다.
- 문서 분류기
-
이 분류기는 각 문서의 첫 페이지를 기준으로 문서를 여러 카테고리 폴더(문서 카테고리를 나타냄)로 그룹화합니다.
또한, 문서 분류기는 한 문서 내의 개별 페이지를 여러 폴더로 분류할 수도 있습니다. 더 큰 문서에 여러 페이지로 된 문서가 포함되어 있는 경우 이 페이지 수준 분류가 완료된 후 개별 페이지를 병합하여 단일 문서로 처리해야 합니다. 예를 들어, 하나의 모기지 문서에 1페이지와 2페이지에 고객 정보(KYC)가 포함되어 있고 3페이지와 4페이지에 고객 은행 거래 내역서가 포함되어 있는 경우, 1페이지와 2페이지는 고객 정보로 분류되어 KYC 폴더에 저장되고, 3페이지와 4페이지는 은행 거래 내역서로 분류되어 은행 거래 내역서 폴더에 저장됩니다. KYC 페이지를 단일 문서로 처리하려면 KYC 폴더에 저장된 페이지 1과 페이지 2를 병합해야 합니다. 마찬가지로, 은행 거래 내역서를 하나의 문서로 처리하려면 은행 거래 내역서 폴더에 저장된 3페이지와 4페이지를 병합해야 합니다.
- Advanced Classifier
- 이 분류기는 문서 분류기의 기능 외에도 하나의 문서를 여러 문서로 분할하고, 사전 정의된 규칙을 사용하여 문서 또는 페이지 수준 분류를 가능하게 합니다. 문서 분류기가 요구 사항을 충족하지 못할 때만 이 분류기를 사용할 것을 권장합니다.
고급 분류기와 문서 분류기의 차이점을 파악하려면 Advanced Classifier와 Document Classifier 비교 항목을 참조하십시오.