Descripción general de la alta disponibilidad y la recuperación ante desastres
- Actualizado: 2021/07/07
Descripción general de la alta disponibilidad y la recuperación ante desastres
Alta disponibilidad (HA) proporciona un mecanismo de conmutación por error si falla un IQ Bot servicio o servidor. La recuperación ante desastres (DR) permite la recuperación a través de una distancia geográficamente separada si un desastre provoca un fallo en todo un centro de datos.
IQ Bot Utiliza un mínimo de 3 nodos y un máximo de 5 nodos en un clúster para alta disponibilidad (HA).
IQ Bot SOLUCIÓN HA y DR
En el contexto de IQ Bot, la implementación de la Alta disponibilidad (HA) y la Recuperación ante desastres (DR) reducen el tiempo de inactividad y mantienen la continuidad del negocio (CoB) para sus actividades con de bot.
- Alta disponibilidad (HA): la alta disponibilidad es un diseño de sistema arquitectónico que intenta salvaguardar un sistema contra ciertos escenarios de fallo. Esto significa que incluso si partes de un sistema están fallando, en su conjunto todavía están disponibles y son utilizables. Las soluciones de alta disponibilidad suelen proteger contra escenarios específicos como: fallos de servidor, fallos de un solo componente, fallos de dependencia, aumentos de carga variables y divisiones de redes cuando dependen de componentes del sistema que se vuelven inalcanzables en una red.
- Recuperación ante desastres (DR): involucra un conjunto de políticas y procedimientos para permitir la recuperación o continuación de la infraestructura y los sistemas vitales después de un desastre natural o provocado por el hombre. La recuperación ante desastres aborda muchas causas diferentes de fallos en un sistema en el que la alta disponibilidad suele ser una de las pocas predecibles. La recuperación ante desastres se centra en restablecer los servicios después de un incidente, no sólo en la conmutación por error. La recuperación de un sistema incluye escenarios tales como: reiniciar un servicio o sistema, restaurar archivos de configuración o una base de datos a partir de copias de seguridad.
Elementos de infraestructura HA y DR necesarios
- Enfoque distribuido: además del agrupamiento en clústeres de IQ Bot y los componentes relacionados del centro de datos, también recomendamos que implemente el IQ Bot en múltiples máquinas y/o servidores virtuales.
-
Equilibrio de carga: Realizado por un equilibrador de carga, se trata del proceso de distribución del tráfico de aplicaciones o de red entre varios servidores para proteger las actividades de servicio y permitir la distribución de cargas de trabajo entre varios servidores. Esto garantiza la actividad de bots continúa en servidores agrupados en clústeres.
-
Bases de datos: las bases de datos utilizan su propia conmutación por error integrada para proteger los datos. Esto asegura la recuperación de datos de la base de datos.
Entre los clústeres de alta disponibilidad, configure la replicación sincrónica entre los servidores de MS SQL agrupados principales (activos) y secundarios (pasivos) en el centro de datos. Esto garantiza la coherencia en caso de que falle un nodo de base de datos.
Para la replicación asincrónica de alta disponibilidad obligatoria, configure una de las siguientes opciones:
- Realice una copia de seguridad de una réplica a los grupos de disponibilidad de Modo de confirmación síncrona del servidor SQL siempre activado
- SQL para la Duplicación de la base de datos del servidor
- Entre los sitios de DR, configure su base de datos para proporcionar una replicación asincrónica desde el sitio de DR primario (producción) al sitio de DR secundario (recuperación) que se encuentra en una ubicación separada geográficamente del sitio de DR primario.
Escenario de muestra
Apunte todas las instancias de IQ Bot ubicadas en el mismo clúster a los mismos archivos de base de datos y repositorio. Esto es necesario para habilitar el uso compartido de datos entre varios servidores y garantizar que la integridad de los datos se mantenga en todos los servidores de IQ Bot dentro de un clúster.
Modelos de implementación HA y DR
Para asegurarse de que su IQ Bot está protegido por HA y/o DR, configure sus centros de datos de acuerdo con los modelos de implementación descritos en:
Requisitos de implementación DE HA
- Instalar IQ Bot en varios servidores.
- El acceso a IQ Bot es a través de un balanceador de carga.
- Abra un puerto de sincronización RabbitMQ entre servidores de IQ Bot.
- Configure el Microsoft SQL Server en modo en alta disponibilidad.
Requisitos de configuración de HA y DR de instalación
- IQ Bot El instalador no admite directamente la instalación en clúster. Para configurar un clúster, haga lo siguiente:
- Ejecute el instalador en cada nodo del servidor de aplicaciones.
- Comparta la
carpeta de salida
con el rol de accesoTodos
. - Después de la instalación, ejecute la
messagequeue_cluster_configuration.bat
junto con los argumentos de línea de comandos apropiados.
- Configurar IQ Bot en una configuración de alta disponibilidad.
- Abra los puertos del firewall: 4369 y 25672.
- Instale RabbitMQ en cada nodo de IQ Bot en el clúster.
El nodo principal es el nodo donde IQ Bot se instaló primero RabbitMQ. El nombre del host del nodo principal se usará para la configuración del clúster de RabbitMQ.
- El balanceador de carga es necesario para distribuir un tráfico a todos los nodos de servidor de IQ Bot.
- Configurar Microsoft SQL Server para una alta disponibilidad. Use la opción Microsoft SQL Server Siempre encendido.
- Para una instalación específica de RabbitMQ, consulte la documentación de RabbitMQ.
Limitaciones conocidas de la HA y la DR
- Para detectar la disponibilidad de instancias de instancias de IQ Bot, un balanceador de carga envía periódicamente pings, intenta conexiones o envía solicitudes para probar las instancias de IQ Bot. Estas pruebas se denominan comprobaciones de estado.
- Las comprobaciones de estado no verifican la disponibilidad de las instancias de RabbitMQ.