创建Vertex Data Store

这是在创建 Grounded by data store Model connection 以使用Google Vertex AI RAG功能之前的一个先决步骤。

您首先需要在 Google Cloud 中创建一个存储桶,然后在 Agent Builder 中创建一个 Vertex Data Store。 我们建议将这些步骤用作示例。

在 Google Cloud 中创建存储桶

在创建数据存储之前,您需要在 Google Cloud 中创建一个存储桶并将您的数据上传到其中。

在 Google Cloud 中创建一个存储桶

  1. 登录到您的 Google Cloud 账户,然后导航到 Cloud Storage 并单击创建存储桶
  2. 为存储桶提供一个名称,并将其余参数保留为默认设置,然后单击继续
  3. 接下来,将您的文档上传到这个新存储桶中。 这可以包括 Vertex Data Store 支持的任何文档格式,例如: PDF、HTML、TXT 等。

创建Vertex Data Store

完成创建存储桶后,您需要导航到 Agent Builder > 数据存储选项卡以创建数据存储。

  1. 创建数据存储 > 选择数据来源屏幕中,选择云存储
    注: 在前面的步骤中,您已经在云存储中创建了一个存储桶。

    在 Agent Builder 中创建数据存储

  2. 选择 从云存储导入数据 > 您要导入哪种类型的数据? > 非结构化文档(PDF、HTML、TXT 等)
  3. 所有其他参数使用默认选择,但需要指定文件夹。
  4. 单击文件夹并选择您之前创建的存储桶,然后单击继续

    配置数据存储

  5. 配置您的数据存储屏幕中,对数据存储位置 字段使用默认选项。
  6. 数据存储名称字段提供一个名称。
    注: 数据存储包括被分块和编码的向量化数据,用于 RAG 解决方案。 如果您想对内容进行分块,您可以在此时进行配置。
  7. 展开文档处理选项部分。

    配置数据存储的文档解析

  8. 文档解析部分,我们建议选择布局解析器,因为它适用于大多数文档类型。
    注: 请参阅 解析和分块文档 .
  9. 选择布局解析器选项可启用文档分块
  10. 接下来,勾选在文档块中包含祖先标题选项,因为这有助于从多个具有数据重叠的文档块中返回更全面的响应。 选择此选项是可选的,具体取决于您的需求。
  11. 单击创建以完成数据存储的配置。

Google Data Store 摘要

Agent Builder 中,导航到应用程序 > 数据存储,然后单击您创建的数据存储。 您将看到数据存储的摘要屏幕,其中包含在 AI Agent Studio 中创建 Grounded by data store Model connection 时需要参考的信息。

数据存储摘要视图

项目 ID
这是项目在 Google Data Store 中显示的 ID。 在 AI Agent Studio 中创建 Grounded by data store Model connection 时,您将需要此值。 当您选择数据存储时,您将发现此 ID。

在哪里找到您的项目 ID

数据存储 ID
AI Agent Studio 中创建 Grounded by data store Model connection 时,您需要使用此 ID 定义身份验证详细信息。
地区
显示数据存储部署区域。

从下拉列表中选择一个地区进行连接,并向 Model connection 进行身份验证。 您还可以添加在 Agent Builder 中创建数据源时配置的地区。 请参阅 创建数据存储 .

已连接的应用程序
显示数据存储连接的应用程序。
注: 如果您想直接在 Google Data Store 中测试数据源,您可以在 Google Data Store 中创建一个应用程序并将其连接到您创建的数据存储。

在 AI Agent Studio 中创建 Google Vertex AI Model connection 所需的身份验证详细信息

在创建数据存储后,上传文档需要一些时间。 单击数据存储 > 活动以查看上传状态。