Crear una instancia de Almacén de datos de Vertex

Este es un paso previo necesario antes de crear una Conexión del modelo Basado en el almacenamiento de datos para utilizar la capacidad de RAG de Google Vertex AI.

Primero debe crear un cubo en Google Cloud y luego crear una Almacén de datos de Vertex en el Constructor de agentes. Recomendamos estos pasos como ejemplo.

Crear un cubo en Google Cloud

Antes de crear un Almacén de Datos, deberá crear un cubo en Google Cloud y subir sus datos allí.

Cree un cubo en Google Cloud

  1. Inicie sesión en la Cuenta de Google Cloud y navegue a Almacenamiento en la nube y haga clic en Crear cubo.
  2. Póngale un nombre al cubo, mantenga los parámetros restantes según la configuración predeterminada y haga clic en Continuar.
  3. A continuación, suba los documentos a este nuevo cubo. Esto podría incluir cualquier formato de documento compatible con Almacén de datos de Vertex, como por ejemplo: PDF, HTML, TXT y otros.

Crear una instancia de Almacén de datos de Vertex

Una vez que haya terminado de crear un cubo, debe navegar a la pestaña Constructor de agentes > Almacén de datos para crear un almacén de datos.

  1. En la pantalla Crear almacén de datos > Seleccionar una fuente de datos, seleccione Almacenamiento en la nube.
    Nota: Ya ha creado un cubo en Cloud Storage en los pasos anteriores.

    Crear un almacén de datos en Constructor de agentes

  2. Seleccione Importar datos desde Cloud Storage > ¿Qué tipo de datos está importando? > Documentos no estructurados (PDF, HTML, TXT entre otros).
  3. Mantenga todos los demás parámetros según la selección por defecto, pero especifique la carpeta.
  4. Haga clic en Carpeta y seleccione el cubo que creó anteriormente, luego haga clic en Continuar.

    Configurar un almacén de datos

  5. En la pantalla Configurar su almacén de datos, mantenga las opciones predeterminadas para el campo Ubicación de su almacén de datos.
  6. Facilite un nombre para el campo Nombre de su almacén de datos.
    Nota: El almacén de datos se compone de datos vectorizados que están fragmentados y codificados, y se utilizan para soluciones de RAG. Si desea fragmentar su contenido, debería configurarlo en este punto.
  7. Expanda la sección Opciones de procesamiento de documentos.

    Configurar el análisis de documentos para el almacén de datos

  8. En la sección Procesamiento de documentos, recomendamos seleccionar Layout Parser ya que funciona bien para la mayoría de los tipos de documentos.
  9. Al seleccionar la opción Layout Parser se habilita la Segmentación de documentos.
  10. A continuación, seleccione la opción Incluir encabezados de ancestros en segmentos, ya que esto ayuda a obtener una respuesta más completa al recopilar información de múltiples fragmentos con datos superpuestos. Marcar esto es Opcional, según sus necesidades.
  11. Haga clic en Crear para completar la configuración del almacén de datos.

Resumen de Almacén de datos de Google

En Constructor de agentes, navegue hasta Aplicaciones > Almacenes de datos y haga clic en el almacén de datos que creó. Verá una pantalla de resumen del almacén de datos con información que consultaría al crear una Conexión del modelo Basado en el almacenamiento de datos en AI Agent Studio.

Vista resumida del almacén de datos

ID del proyecto
Este es el ID del proyecto tal como aparece en Almacén de datos de Google. Necesitaría este valor al crear una Conexión del modelo Basado en el almacenamiento de datos en AI Agent Studio. Encontrará este ID cuando seleccione el almacén de datos.

Dónde encontrar el ID de proyecto

ID del almacén de datos
Utilizaría este ID para definir los detalles de autenticación al crear una Conexión del modelo Basado en el almacenamiento de datos en AI Agent Studio.
Región
Muestra la región en la que se ha implementado el almacén de datos.

Seleccione una región de la lista desplegable para conectarse y autenticar la Conexión del modelo. También puede agregar la región que configuró cuando creó una fuente de datos en Constructor de agentes. Consulte Crear un almacén de datos .

Aplicaciones conectadas
Muestra las aplicaciones a las que está conectado el almacén de datos.
Nota: Puede crear una Aplicación en Almacén de datos de Google y conectarla al almacén de datos que creó, si desea probar la fuente de datos directamente en Almacén de datos de Google.

Se necesitan detalles de autenticación para crear una Conexión del modelo Google Vertex AI en AI Agent Studio

Una vez creado un almacén de datos, cargar documentos tarda un tiempo. Haga clic en Almacén de Datos > Actividad para ver el estado de la carga.