Google CDE(Custom Document Extractor)용 Document Automation 지원
- 최종 업데이트2024/10/31
Google CDE(Custom Document Extractor)용 Document Automation 지원
Document Automation에서 사용자 교육 학습 인스턴스를 생성해 Google Custom Document Extractor(CDE) 프로세서를 사용하여 추출할 수 있습니다.
새로운 기능은 50개 언어를 지원하는 모든 문서 유형에 대해 Google Custom Document Extractor(CDE)를 사용하여 모델을 교육하는 데 사용할 수 있습니다. 모델이 배포되면 프로세서 URL이 Document Automation 추출 프로세스 내에 내장될 수 있습니다
Google CDE를 사용하려면 다음이 필요합니다.
- Google Document AI 워크벤치에 대한 Google 구독.
- 프로세서를 생성하기 위해 문서 AI 편집기 역할을 할당하고 Google Cloud Platform에 서비스 계정을 만들었습니다. Create service accounts 및 IAM roles for Document AI의 내용을 참조하십시오.
- 를 위한 라이선스입니다.
주: Google CDE의 API URL 신뢰할 수 있는 목록을 사용하는 경우, API를 Bot 에이전트 기기의 신뢰할 수 있는 목록에만 추가해야 합니다. Google CDE에 허용되는 API 목록은 다음과 같습니다.
- Google 계정
- Google OAuth
- Google APIS
- 프로세서 엔드포인트(신뢰할 수 있는 목록에 추가할 호스트만 해당)예:
https://eu-documentai.googleapis.com/v1/projects/<<Project ID>>/locations/eu/processors/<<Processor ID>>:process
Google CDE 사용
Google CDE로 모델을 만들고 유지 관리하는 데 드는 노력은 다음과 같은 다양한 시나리오로 정당화할 수 있습니다.
- 언어 지원 확장 추가 언어에 대한 지원이 필요한 문서로 작업할 때 사전 학습된 기존 모델이 해당 기능을 제공하지 않는 경우 Google CDE가 필수적입니다.
지원되는 언어에 대해서는 Google CDE의 언어 지원을 참조하십시오.
- 지원되지 않는 문서 형식: Google CDE는 호환되는 파서가 없는 문서 유형을 처리할 때 유용합니다.
- 정확성 및 성능 문제 해결: 특정 문서 형식에서는 사전 학습된 모델을 사용하더라도 원하는 정확도를 달성하기 어려울 수 있습니다. 문서에 대한 구체적인 교육이 포함된 Google CDE를 사용하면 정확도를 높일 수 있습니다.
- 사용자 지정 또는 비표준 필드 추출: Google CDE는 사용자 정의 또는 비표준 형식의 문서에서 특정 필드를 추출해야 하는 시나리오에서 사용할 수 있습니다.
- 라벨이 존재하지 않는 경우 특정 트레이닝을 기반으로 추출: Google CDE는 사전 정의된 라벨이 존재하지 않는 필드에서 정보를 추출해야 할 경우 유용합니다.