MTBF significa Mean Time Between Failures ou Tempo Médio Entre Falhas e muitos profissionais utilizam este valor para medir a confiabilidade de dispositivos de hardware, especialmente discos rígidos. Mas esta ideia normalmente está equivocada.
Para entender porque comparar MTBF de equipamentos diferentes pode ser um erro, nós precisamos primeiro entender como este parâmetro é medido.
Em um laboratório, o fabricante executa um teste usando uma quantidade “x” de amostras do produto a ser testado durante “y” horas.
Primeiro o fabricante calcula a quantidade total de horas em que os equipamentos ficaram ligados, também chamado TPOH (Total Power-On Hours). Isto é feito multiplicando-se a quantidade de dispositivos testados (“x”) pelo número de horas que o teste foi executado (“y”). Feito isso o TPOH é dividido pela quantidade de dispositivos que falharam no teste, e este resultado é o MTBF.
Por exemplo, se 1.000 dispositivos são testados por 30 dias seguidos (720 horas), nós temos um TPOH de 720.000 horas. Se durante este período apenas dez dispositivos apresentarem problemas, nós temos um MTBF de 72.000 horas.
Este número, no entanto, não significa que você deve esperar que o produto apresente problema, em média, após 72.000 horas, simplesmente porque cada dispositivo individual não foi testado 720.000 horas, mas apenas durante 720 horas.
E você não pode usar este número para comparar produtos que utilizam metodologias de teste de MTBF diferentes. Por exemplo, se você tem um produto com um MTBF de 72.000 horas, como no exemplo dado, e compará-lo com um produto com MTBF de 100.000 horas, isto não necessariamente significa que o segundo produto tem uma confiabilidade maior. O segundo fabricante pode ter usado uma combinação diferente de dispositivos testados e horas de funcionamento para obter este resultado. Como os resultados foram obtidos usando metodologias diferentes, eles não podem ser comparados.
Então o que o MTBF de um equipamento significa? Significa que no teste conduzido pelo fabricante, uma amostra apresenta problema a cada “x” horas de teste – o MTBF. Em nosso exemplo, um dispositivo apresenta problema a cada 72.000 horas de teste, em média. Mas sem saber exatamente a metodologia usada, é praticamente impossível fazer comparações corretas entre produtos.
Para piorar as coisas, a definição de falha pode variar entre fabricantes. Por exemplo, um fabricante testando o MTBF de um arranjo RAID1 pode considerar uma falha quando um dos discos rígidos apresenta problemas, mas outro fabricante pode não considerar esta falha se o sistema ainda continuar funcionando mesmo com um dos discos dando defeito (pois o disco de espelhamento entrou em ação impedindo o usuário de parar o trabalho e perder dados). A mesma coisa é válida para todos os outros tipos de equipamentos. Se uma fonte de alimentação desligou, mas não “queimou”, durante o cálculo do MTBF, o fabricante pode escolher não contar isto como uma falha (já que a fonte ainda está funcionando depois de religada). Mais uma vez, você não pode comparar valores de MTBF usando metodologias diferentes.
Confiabilidade dependerá de vários outros fatores que não são medidos pela metodologia de cálculo do MTBF. Como um exemplo prático, a temperatura padrão para testes de equipamento é de 25º C, mas várias vezes os componentes começam a apresentar problemas em temperaturas mais elevadas. Portanto, qualquer tipo de teste conduzido pelo fabricante não necessariamente reflete a realidade ambiental de onde o produto será usado.
No comments:
Post a Comment