A interrupção da British Airways, como a maioria das interrupções nos data centers, foi causada por seres humanos

“Somos o gerente das instalações de nosso cliente BA e apoiamos totalmente a investigação. Ainda não foi tomada nenhuma decisão com relação às causas do incidente de 27 de maio”, disse o porta-voz.

Esse não foi um acidente pequeno. Estima-se que tenha custado à BA cerca de 100 milhões de euros (US$ 112 milhões), sem contar o prejuízo que a BA teve com a interrupção do serviço.

Esse não é um incidente isolado. Mais recentemente, em março, a Amazon Web Services sofreu uma grande interrupção quando um de seus funcionários estava depurando um problema no sistema de faturamento e acidentalmente colocou mais servidores off-line do que pretendia. Esse erro deu início a um efeito cascata que derrubou outros sistemas, resultando na interrupção.

Humanos, a causa da maioria das falhas de data center

Errar é humano, e nós erramos muito.

Um estudo de 2016 do Ponemon Institute constatou que o erro humano foi a principal causa de falha, sendo responsável por 22% das interrupções do data center, enquanto a falha de água, calor ou ar condicionado foi responsável por 11% das interrupções, o clima foi responsável por 10% e as falhas do gerador foram de 6%. O mau funcionamento dos equipamentos de TI foi responsável por apenas 4% de todas as interrupções.

Isso ocorre porque o setor de TI não faz um bom trabalho ao instruir seus funcionários sobre os processos adequados para gerenciar esses equipamentos. Dois terços das interrupções dos data centers estão relacionados a processos, não a sistemas de infraestrutura, de acordo com David Boston, diretor de soluções de operações de instalações da TiePoint-bkm Engineering.