Introducción Failover Clúster

Failover clúster es una característica que se encuentra disponible desde la versión de Windows Server 2012 R2.

Se trata de una solución de alta disponibilidad. Está formada por una serie de máquinas, llamadas nodos, que ofrecen un servicio.

Es una de las técnicas mas usadas en entornos empresariales para conseguir disponibilidad, es imposible conseguir un 100% de disponibilidad, por lo que se busca obtener siempre la disponibilidad acordada con el cliente en el SLA (Service Level Agreement).

Funcionamiento de un Failover Clúster

En una estructura de Failover Clúster solo uno de los nodos estará ofreciendo el servicio en un momento determinado y el resto de los nodos estarán a la espera (standby) por si el primer nodo falla. Entre los nodos habrá una comunicación constante para detectar cuándo falla el nodo activo. Si el nodo activo falla, se lleva a cabo la conmutación (Failover) por error, de forma que uno de los nodos pasivos toma su lugar.

Failover clúster no se trata de una solución en la que todos los nodos ofrecen un servicio simultáneamente y se reparten las tareas.

La estructura Failover Clúster que ha sido montada para la demostración, consta de dos nodos Windows Server 2016 (Nodo1 y Nodo2) unidos a un controlador de dominio alojado en una maquina Windows Server 2016. Esta máquina actuará de controlador de dominio y de servidor de almacenamiento ISCSI.

A través del servidor de ISCSI se compartirán dos discos a cada nodo:

  • Uno de 100 GB, que actuara de almacenamiento compartido entre los nodos.
  • Uno de 1 GB, que actuará como disco de testigo para el Quorum.

Quorum es la característica que utiliza Failover Clúster para desempatar en el caso de que se produzca un Split Brain.

En WS 2016 por defecto, esta habilitado Dynamic Quorum. En este modo, se asigna o retira un voto al disco de testigo de forma automática según si el número de nodos es par o impar.

Existen otros modos de Quorum:

  • Node Majority: Solo los nodos del clúster tienen voto, este modo se usa para un número de nodos impar.
  • Node and Disk Majority: Los nodos del clúster y el disco de testigo tienen voto, solo debería usarse cuando tenemos un número par de nodos.
  • No Majority, Disk Only: Solo tiene voto el disco de testigo.

El disco de testigo puede ser un disco duro compartido o una carpeta compartida.

Requisitos Failover Cluster

Para poder instalar correctamente la característica de Failover Clúster debemos tener en cuenta los siguientes requisitos:

  • Debemos asegurarnos de que todos los nodos ejecuten la misma versión de Windows Server.
  • Es recomendable separar las redes en las que se montará el Failover clúster:
    • Red de acceso, es la red que ofrecerá salida fuera del clúster.
    • Red de almacenamiento: es la red por la cual se compartirán los discos ISCSI.
    • Red de clúster: es la red por la que los nodos mantienen una comunicación constante (HeartBeat), para detectar cuando falla el nodo activo.

Las tarjetas usadas por los nodos deben ser del mismo ancho de banda, el mismo método de duplexy que soporten RSS y RDMA.

  • Es recomendable que todos los nodos que deseamos agregar al clúster estén unidos al mismo dominio de Active Directory, así la configuración será más sencilla. Es posible también crear un Failover Clúster en grupos de trabajo (WorkGroup) o dominios diferentes.
  • Instalar las características de Failover Clúster e HyperV en todos los maquinas que queramos añadir al clúster.
  • Debemos ejecutar el asistente para la validación de clústeres a fin de validar la configuración. Debemos tener por lo menos dos nodos para ejecutar todas las pruebas.
  • Debemos asegurarnos de que la cuenta que usaremos para crear el clúster sea un usuario de dominio con derechos de administrador en todos los servidores que queramos agregar como nodos al clúster.

Failover Clúster se considera una técnica muy importante para intentar llegar a la tan codiciada alta disponibilidad. Junto con otras técnicas de disponibilidad y continuidad blindaremos a nuestras infraestructuras ante posibles errores o perdidas de información.

Autor/a: Daniel Gutiérrez Moreno

Curso: Microsoft MCSA Windows Server 2016 + Azure + AWS

Centro: Tajamar

Año académico: 2019-2020

Linkedin: www.linkedin.com/in/daniel-gutiérrez-moreno-84574874

Leave a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.