Cómo funciona Auto Remediation en VMware Cloud on AWS

Nodos físicos reemplazados en minutos
16 de diciembre de 2020 por
Nicolas Solop

¿Cómo funciona auto remediation en VMware on AWS?


En este post quiero contarte cómo funciona el auto remediation, la función de remediación de clusters de VMware on AWS, para tolerar y accionar ante la falla de uno o más hosts de un cluster.

Junto con el balanceo de carga en VMC, una de las más grandes dudas con las que nos encontramos por parte de nuestros clientes es: ¿qué pasa si un host del cluster de VMware en AWS sale de servicio?.

Para responder a esta pregunta tenemos que conocer un poco más sobre cómo funciona la función de Auto Remediation en VMware on AWS,  o simplemente, VMC


¿Qué es Auto remediation en VMware on AWS?

¿Qué pasa si un host del cluster en AWS se muere? Para responder a esto tenemos que hablar de Auto Remediation. 

A diferencia de cuando tenemos los hosts en nuestro centro de cómputos y somos responsables por accionar ante la falla del hardware de uno de éstos, cuando hablamos de VMware Cloud on AWS el responsable de accionar ante la falla de hardware y resolver la situación es VMware.

Si bien es invisible para el usuario final, es importante discutir cómo funciona para que puedas entender qué es lo que está pasando cuando se dispara y qué se verá  en la consola cuando sucede.


¿Cómo funciona Auto remediation en VMware on AWS?

Uno podría pensar que el funcionamiento es similar al de VMware High Availability (HA) que está hace años a disposición de los usuarios. La realidad es que el enfoque es un poco diferente debido a las características de la solución.

VMware monitorea el correcto funcionamiento de los clusters de VMware Cloud on AWS y ante la falla de algún componente puede poner a disposición del cliente un hardware nuevo, de forma automática, y muy pero muy rápido.

Debido a estas dos cosas, ante una falla se aprovisiona un nuevo servidor en cuestión de minutos, y como a nivel de almacenamiento se utiliza VSAN, las máquinas virtuales se sincronizarán al nuevo servidor y por medio de HA, serán encendidas.

El proceso de Auto Remediation en VMware on AWS es completamente automático y dependiendo del tipo de servicio que ejecuten las máquinas virtuales afectadas, probablemente el usuario final no llegue a enterarse.

Si bien DRS y HA corren en los clusters, la funcionalidad de Elastic DRS en VMC hace que reemplazar un nodo que sale de servicio por problemas sea algo muy rápido.

Para conocer un poco más sobre cómo funciona Auto remediation en VMware on AWS les dejo este video donde pueden ver una simulación de caída de un host del cluster y cómo Auto Remediation resuelve la situación agregando un nuevo host.


Si querés conocer más sobre Auto remediation en VMware on AWS o de las soluciones de VMware Cloud, escribinos y te responderemos a la brevedad.