Verano Horribilis para los Data Centers: Es la UPS, estúpidos!

Lejos de ser original, el título del post tiene un claro guiño en la frase final a la frase que se popularizó en la campaña de Clinton contra Bush en 1992. Espero me permitáis esa licencia.

Bueno ya centrados en lo nuestro, vaya veranito llevamos de caídas de Data Centers! En los muchos años que llevo dedicado a este sector no recuerdo un periodo con tantos Downtimes de DC de cierta envergadura.

Para los que no sigáis el día a día del sector os hago rápidamente un recopilatorio:

·     20/Julio. Southwest Airlines. Caída del Data Center Corporativo por fallo en un Router, que provocó la cancelación de 2300 vuelos y unas pérdidas estimadas de 54 Millones $.

·     20/Julio. Telecity LD8. Downtime del servicio en este centro de colocation situado en los Docklands de Londres por fallo de una UPS.

·     21/Julio. Telehouse. Downtime del servicio de este centro de colocation situado también en los Docklands por disparo de un interruptor. (No será la misma caída que el anterior?)

·     8/Agosto. Delta Airlines. Caída del Data Center Corporativo por fallo durante las pruebas de un generador de emergencia, dio lugar a un incendio, que provocó la cancelación de 2000 vuelos y unas pérdidas estimadas de 150 Millones $.

·     6/Septiembre. Downtime del servicio de centro de colocation situado en Brasil por fallo de un módulo de UPS. El fallo provocó un incendio que dio lugar a cortes de ambas ramas de parte de la instalación.

·     10/Septiembre. ING Rumanía. Caída del servicio del banco durante cuatro horas como consecuencia de pruebas de extinción de incendio mediante gas inerte. Su disparo produjo niveles sonoros superiores a 130 dB(A) que dañaron seriamente docenas de cabinas de almacenamiento. Este efecto es conocido desde hace tiempo, ¿cómo puede seguir pasando?.

·     10/Septiembre. Global Switch, Docklands – Londres. Downtime del servicio de este centro de colocation situado también en los Docklands por un fallo en la conexión de un cable de media tensión en la caja de conexión de una DRUPS.

·     24/Septiembre. Fujitsu. Un incidente físico, (aún no hemos averiguado cual), ha tirado abajo los sistemas IT de la FCA (Financial Conduct Authority) del Reino Unido.

Como podéis ver han sido unos cuantos y eso que sólo tenemos aquí los que se han hecho públicos. De estos datos saco dos conclusiones: algo pasa en los Docklandds de Londres y que hay que extremar las precauciones con las UPS.

Respecto a los Docklands, zona con mucha superficie de Data Center instalada, es posible que tanto el sistema eléctrico como el de comunicaciones esté al limite y ello provoque mayor número de incidentes.

Y respecto a las UPS…, qué deciros que no sepáis. Es el equipamiento más importante en las instalaciones de un Data Center. Es el elemento del sistema eléctrico que elimina las perturbaciones eléctricas y garantiza el suministro de energía hasta el arranque de los grupos electrógenos ante un corte de compañía.

Según un informe de Ponemon Institute (esponsorizado por Emerson. Link: http://www.emersonnetworkpower.com/en-US/Resources/Market/Data-Center/Latest-Thinking/Ponemon/Documents/2016-Cost-of-Data-Center-Outages-FINAL-2.pdf ), el fallo de las UPS es el primer motivo de interrupción de servicio no planificado en un Data Center, con un 25% de cuota. En segunda posición aparece el Cybercrimen con ataques DDoS y en tercer lugar el error humano como podéis ver en el siguiente cuadro.

Me preocupa mucho este dato de fallos en UPS y más si posteriormente originan incendio que originan incendio. ¿Es que acaso están siendo diseñadas al límite en sus componentes? ¿no se está haciendo el mantenimiento adecuado?

Al final, por mucho que se predique de la gravedad de las consecuencias que puede ocasionar un fallo en un Data Center para una compañía, parece que no aprendemos y en muchos casos se siguen eligiendo proveedores (ingenierías, suministradores y contratistas) en base únicamente al precio y en algunos casos por diferencias ridículas. Espero que estos casos que se han dado en los últimos meses sirvan para que se intente hacer la elección de colaboradores de una forma más rigurosa.

Un abrazo fuerte a todos y gracias por compartir y/o recomendar mis posts.

Ricardo Abad

Managing Director Quark

This site uses third-party cookies to improve your browsing experience.