Crear una instancia de Almacén de datos de Vertex
- Última actualización2024/11/20
Crear una instancia de Almacén de datos de Vertex
Este es un paso previo necesario antes de crear una Conexión del modelo Basado en el almacenamiento de datos para utilizar la capacidad de RAG de Google Vertex AI.
Primero debe crear un cubo en Google Cloud y luego crear una Almacén de datos de Vertex en el Constructor de agentes. Recomendamos estos pasos como ejemplo.
Crear un cubo en Google Cloud
Antes de crear un Almacén de Datos, deberá crear un cubo en Google Cloud y subir sus datos allí.
- Inicie sesión en la Cuenta de Google Cloud y navegue a Almacenamiento en la nube y haga clic en Crear cubo.
- Póngale un nombre al cubo, mantenga los parámetros restantes según la configuración predeterminada y haga clic en Continuar.
- A continuación, suba los documentos a este nuevo cubo. Esto podría incluir cualquier formato de documento compatible con Almacén de datos de Vertex, como por ejemplo: PDF, HTML, TXT y otros.
Crear una instancia de Almacén de datos de Vertex
Una vez que haya terminado de crear un cubo, debe navegar a la pestaña
para crear un almacén de datos.- En la pantalla Almacenamiento en la nube.Nota: Ya ha creado un cubo en Cloud Storage en los pasos anteriores.
, seleccione
- Seleccione .
- Mantenga todos los demás parámetros según la selección por defecto, pero especifique la carpeta.
- Haga clic en Carpeta y seleccione el cubo que creó anteriormente, luego haga clic en Continuar.
- En la pantalla Configurar su almacén de datos, mantenga las opciones predeterminadas para el campo Ubicación de su almacén de datos.
- Facilite un nombre para el campo Nombre de su almacén de datos.Nota: El almacén de datos se compone de datos vectorizados que están fragmentados y codificados, y se utilizan para soluciones de RAG. Si desea fragmentar su contenido, debería configurarlo en este punto.
- Expanda la sección Opciones de procesamiento de documentos.
- En la sección Procesamiento de documentos, recomendamos seleccionar Layout Parser ya que funciona bien para la mayoría de los tipos de documentos.Nota: Consulte Analizar y segmentar documentos .
- Al seleccionar la opción Layout Parser se habilita la Segmentación de documentos.
- A continuación, seleccione la opción Incluir encabezados de ancestros en segmentos, ya que esto ayuda a obtener una respuesta más completa al recopilar información de múltiples fragmentos con datos superpuestos. Marcar esto es Opcional, según sus necesidades.
- Haga clic en Crear para completar la configuración del almacén de datos.
Resumen de Almacén de datos de Google
En Constructor de agentes, navegue hasta y haga clic en el almacén de datos que creó. Verá una pantalla de resumen del almacén de datos con información que consultaría al crear una Conexión del modelo Basado en el almacenamiento de datos en AI Agent Studio.
- ID del proyecto
- Este es el ID del proyecto tal como aparece en Almacén de datos de Google. Necesitaría este valor al crear una Conexión del modelo
Basado en el almacenamiento de datos en AI Agent Studio. Encontrará este ID cuando seleccione el almacén de datos.
- ID del almacén de datos
- Utilizaría este ID para definir los detalles de autenticación al crear una Conexión del modelo Basado en el almacenamiento de datos en AI Agent Studio.
- Región
- Muestra la región en la que se ha implementado el almacén de datos.
Seleccione una región de la lista desplegable para conectarse y autenticar la Conexión del modelo. También puede agregar la región que configuró cuando creó una fuente de datos en Constructor de agentes. Consulte Crear un almacén de datos .
- Aplicaciones conectadas
- Muestra las aplicaciones a las que está conectado el almacén de datos.Nota: Puede crear una Aplicación en Almacén de datos de Google y conectarla al almacén de datos que creó, si desea probar la fuente de datos directamente en Almacén de datos de Google.
Una vez creado un almacén de datos, cargar documentos tarda un tiempo. Haga clic en
para ver el estado de la carga.