自适应搜索查询
- Updated: 2025/10/10
自适应搜索查询
通过 自适应搜索查询 功能,用户能够在单个学习实例中针对具有相似布局的文档测试和定义特定搜索查询,从而提升不同文档格式的数据提取准确性。
在处理布局统一的文档的学习实例中,单一组搜索查询便能发挥作用。 然而,在处理具有多样化布局的文档时,此类查询可能无法达到预期效果,即使这些文档属于特定文档类型,例如发票和收据。
自适应搜索查询 功能允许用户在单个学习实例中,针对具有相似布局的一组文档测试不同的搜索查询。 例如,如果您正在测试包含以下不同文档集的发票数据提取功能:
- 包含单一产品购买明细的发票。
- 包含多种产品购买明细的发票。
在此场景下,单一的搜索查询可能无法有效提取所需的数据。 使用 自适应搜索查询 功能,您可以为每组文档定义特定的搜索查询,以实现良好的效果。
在测试模式下,为一组具有相似布局和内容的文档生成唯一的集群 ID。 您可以为此类文档的表单和表格字段定义并测试搜索查询。
使用 自适应搜索查询 功能,您可以执行以下操作:
- 在集群级别对搜索查询进行测试和验证。
- 在单个学习实例内,为同一字段在多个集群中定义不同的搜索查询。
- 将经过验证的集群特定查询提升到实际正式环境,以实现稳健且一致的数据提取性能。
- 减少手动查询调整,并在单一、统一的学习实例中提升对各种文档格式的提取准确性。
优势
- 提高准确性: 提高同一学习实例内不同布局的提取成功率。
- 减少手动调整: 最大限度地减少在定义所需搜索查询时的重复试错。
- 简化导航: 通过在集群级别优化查询,避免反复调整。
- 可追溯性: 允许通过版本历史记录追踪搜索查询的变化。 请参阅 查看学习实例的版本历史记录。
可用性
- 文档提取 软件包版本必须为 3.38.8 或更高版本。
- 自适应搜索查询 功能仅在测试模式下可用。 请参阅 测试学习实例。
- 非结构化文档类型不支持 自适应搜索查询 功能。
- 用户必须同时拥有验证者用户角色和训练学习实例组权限。 请参阅 Document Automation 用户。
- 学习实例必须在生成式 AI 驱动的数据提取选项中使用提供程序进行数据提取。