Google CDE(Custom Document Extractor)용 Document Automation 지원

Document Automation에서 사용자 교육 학습 인스턴스를 생성해 Google Custom Document Extractor(CDE) 프로세서를 사용하여 추출할 수 있습니다.

새로운 기능은 50개 언어를 지원하는 모든 문서 유형에 대해 Google Custom Document Extractor(CDE)를 사용하여 모델을 교육하는 데 사용할 수 있습니다. 모델이 배포되면 프로세서 URL이 Document Automation 추출 프로세스 내에 내장될 수 있습니다

Google CDE를 사용하려면 다음이 필요합니다.
  • Google Document AI 워크벤치에 대한 Google 구독.
  • Document Automation 플랫폼 > 문서 워크스페이스 페이지를 위한 라이선스
주: Google CDE의 API URL 신뢰할 수 있는 목록을 사용하는 경우, API를 Bot 에이전트 기기의 신뢰할 수 있는 목록에만 추가해야 합니다. Google CDE에 허용되는 API 목록은 다음과 같습니다.
  • Google 계정
  • Google OAuth
  • Google APIS
  • 프로세서 엔드포인트(신뢰할 수 있는 목록에 추가할 호스트만 해당)
    예:
    https://eu-documentai.googleapis.com/v1/projects/<<Project ID>>/locations/eu/processors/<<Processor ID>>:process

Google CDE 사용

Google CDE로 모델을 만들고 유지 관리하는 데 드는 노력은 다음과 같은 다양한 시나리오로 정당화할 수 있습니다.
  • 언어 지원 확장 추가 언어에 대한 지원이 필요한 문서로 작업할 때 사전 학습된 기존 모델이 해당 기능을 제공하지 않는 경우 Google CDE가 필수적입니다.

    지원되는 언어에 대해서는 Google CDE의 언어 지원을 참조하십시오.

  • 지원되지 않는 문서 형식: Google CDE는 호환되는 파서가 없는 문서 유형을 처리할 때 유용합니다.
  • 정확성 및 성능 문제 해결: 특정 문서 형식에서는 사전 학습된 모델을 사용하더라도 원하는 정확도를 달성하기 어려울 수 있습니다. 문서에 대한 구체적인 교육이 포함된 Google CDE를 사용하면 정확도를 높일 수 있습니다.
  • 사용자 지정 또는 비표준 필드 추출: Google CDE는 사용자 정의 또는 비표준 형식의 문서에서 특정 필드를 추출해야 하는 시나리오에서 사용할 수 있습니다.
  • 라벨이 존재하지 않는 경우 특정 트레이닝을 기반으로 추출: Google CDE는 사전 정의된 라벨이 존재하지 않는 필드에서 정보를 추출해야 할 경우 유용합니다.