Lo de las alarmas es historia antigua

Revisando el cronograma de ejecución de las operaciones de IT que tenemos dentro de un contrato con un cliente de wetcom surgió una discusión interesante…

Alarm Bells by Steve Marlow || https://goo.gl/cg7Urr

Alarm Bells by Steve Marlow || https://goo.gl/cg7Urr

Uno de los pedidos del cliente fue el de crear un informe de las alarmas de la infraestructura que se habían generado en un período de tiempo. Supuestamente les permitiría analizar el origen de las alarmas para tomar un curso de acción para evitar que las mismas vuelvan a ocurrir.

Al comenzar el análisis para automatizar la tarea llegamos a la conclusión de que sin importar que tan rápido pudiéramos generar el informe siempre íbamos a llegar tarde. Es decir, siempre se iban a tener que ejecutar actividades posteriores, a mano, que para el momento de ejecutarlas podrían llegar a hacer más mal que bien.

¿Entonces, como podemos atacar este tema?.

La alarmas en TI son algo viejo, en todo sentido. Existen desde mucho antes de que yo empezara a trabajar en sistemas antes del año 2000… también son viejas cuando tenemos que analizarlas a menos que tengamos en casa un centro de monitoreo.

Estamos tratando el problema de la misma manera que hace 20 años. Algo pasa, se toca un umbral, una alarma de dispara.

Igual que en los años 90, igual que con los servidores físicos.

No aprendimos nada.

El enfoque de buscar soluciones de monitoreo que solo hagan eso, montiroear, me hace dudar de cuanto logramos evolucionar como gestores de IT.

Hoy en día con las infraestructuras tan dinámicas que tenemos gracias al cloud y a la virtualización deberíamos estar más enfocados en analizar e implementar soluciones que, en lugar de disparar alarmas, se encarguen de que estas no lleguen nunca a dispararse.

Ver y Hacer en el monitoreo de la infraestructura

Históricamente las soluciones de monitoreo tenían el objetivo de disparar una alarma en caso de que un umbral sea alcanzado y como máximo correlacionar eventos para analizar si una alarma debía ser disparada ante un evento anterior.

Eso era así en el mundo físico y se sigue realizando de la misma manera en el virtual.

Es por esto que las soluciones como las de Turbonomic, que no solo ven, sino que también hacen para evitar el disparo de las alarmas tienen tanto éxito en estos días.

Porque la idea de que la infraestructura por si misma tenga la capacidad de tomar y ejecutar las decisiones que mejor apliquen en ese momento es lo que deberíamos hacer. Seguramente existan alarmas que no se puedan evitar pero me animo a decir que el 70% de las alarmas disparadas pueden ser evitadas o bien ya son obsoletas al momento de analizarlas.

Si se implementan estas tecnologías que “hacen” además de mirar tendremos mayor disponibilidad de tiempo, un recurso tan escaso hoy en día, para dedicarnos a tareas de mayor valor dentro de la organización.

Esto sin contar que si recibimos menos alarmas, estamos diciendo en realidad que nuestras aplicaciones y servicios están disponibles más tiempo y con los recursos de infraestructura necesarios.

Pensemos en menos alarmas y más en automatizar las operaciones de TI. Vamos a tener algo más interesante para hacer día a día.

De la misma manera, estaremos ahorrando en infraestructura… pero lo dejo para otro post!.

 

No existen comentarios.

Dejanos tu comentario

Message