使用 Microsoft Azure Computer Vision OCR 引擎

Microsoft Azure Computer Vision OCR 引擎 是一个云端 OCR 引擎,所有 IQ Bot 的客户都可以使用。IQ Bot 自动化了一些 Microsoft Azure Computer Vision OCR 引擎 的安装步骤。

当您使用 Microsoft Azure Computer Vision OCR 引擎 处理文档时,数据会立即被删除。Microsoft Azure Computer Vision OCR 引擎 在数据提取方面提供大约 80% 的准确率。 有关数据保留隐私的更多信息,请参阅 Microsoft Azure Cognitive Services
注: IQ Bot 还支持 Microsoft Azure Computer Vision OCR 引擎 的容器化部署:

Configure IQ Bot using Docker container and Azure OCR (A-People login required)

创建学习实例时,您可以从文档主要语言下拉菜单中选择任意语言。 在处理过程中,OCR 引擎尝试自动检测主要语言,并且可以覆盖您的选择。 例如,您可以指定英语,但如果上传西班牙语文档,API 将尝试处理西班牙语。

提示: 您可以排查从低质量或手写文档中提取数据的任何问题 IQ Bot unable to extract data from low quality and Handwritten documents (A-People login required)
按照步骤配置 Settings.txt 文件并使用 Microsoft Azure Computer Vision OCR 引擎
重要: 配置 settings.txt 文件不适用于 Automation 360 IQ Bot 云部署

过程

  1. 确保您的 IQ Bot 服务器具有互联网连接和外部 DNS 分辨率。
    选中以在默认端口 = 443 上为 API 端点启用通信:default endpoint = https://aai-iq-bot-ocr.cognitiveservices.azure.com/
    注: 要验证与 API 端点和服务器的连接,请打开服务器上的网页浏览器,然后键入 API 端点的完整 URL。 如果浏览器返回 404 错误,则意味着收到来自 API 端点的响应。
  2. 您可以使用自己的 Microsoft Azure Computer Vision OCR 引擎 订阅或拼写检查密钥。 有关详细信息,请参阅 对于 Microsoft Azure Computer Vision OCR 引擎 使用您自己的密钥
  3. 可选: C:\Program Files (x86)\Automation 360 IQ Bot <version number>\Configurations 文件夹中,打开 Settings.txt 文件,并将 OCR 引擎值更改为 OCREngine=Tesseract4 或将 OCREngine=Abbyy 更改为 OCREngine=MicrosoftAzureAPI。 然后保存文件。
  4. C:\Program Files (x86)\Automation 360 IQ Bot\Configurations 运行 stopanduninstallallservices.bat 文件。
    停止服务后,运行 installandstartallservices.bat 文件以安装和启动服务。
  5. IQ Bot 中创建学习实例,然后对文本分段使用 Microsoft Azure Computer Vision OCR 引擎 并对这些学习实例使用 OCR 引擎。
    对于这些学习实例,您可以继续使用 IQ Bot 功能进行文档分类、自动映射字段、认知提取和字段值自动更正的功能。
用于Microsoft Azure Computer Vision OCR 引擎的服务 URL 列表(可选)
  • https://aai-iq-bot-ocr.cognitiveservices.azure.com/
  • https://aai-iq-bot-ocr-spellcheck.cognitiveservices.azure.com/
注: 所有 URL 指向美国的全球服务地区。

如果 IQ Bot 无法使用 Microsoft Azure Computer Vision OCR 引擎 处理文档,请参阅故障排除提示。

IQ Bot unable to process the document with Microsoft Azure OCR (A-People login required)