Prevendo defeitos no HD
Um dos problemas fundamentais dos HDs é que, por guardarem uma quantidade muito grande de informações, qualquer defeito tem um efeito potencialmente catastrófico. É muito diferente de riscar ou perder um CD-ROM, por exemplo, já que o CD armazena uma pequena quantidade de dados, geralmente cópias de dados que estão gravados em algum outro lugar.
A boa notícia sobre os defeitos mecânicos é que, na maioria dos casos, eles são causados por desgaste cumulativo, de forma que, antes de parar definitivamente, o HD emite sinais que permitem perceber que algo está errado.
Tudo geralmente começa com uma redução progressiva no desempenho, causada por desgaste do motor de rotação, desgaste do sistema que movimenta as cabeças de leitura, erros de leitura ou as três coisas combinadas.
Outro sinal característico é um barulho de "click click" no início do boot (que com o tempo passa a se tornar mais e mais freqüente, até que o HD passa a não fazer outra coisa ao ser ligado), que indica problemas de posicionamento das cabeças de leitura, causados por envelhecimento da mídia ou danos cumulativos nas próprias cabeças. É normal que o HD emita um "click" ao ser ligado ou retornar do modo de economia de energia, mas clicks repetidos são sinal de problemas.
Outros sinais, menos visíveis, são monitoradas pela própria placa lógica do HD, utilizando um sistema chamado S.M.A.R.T. O relatório é armazenado em uma área de memória não volátil do HD e guarda informações estatísticas armazenadas desde o primeiro boot.
O S.M.A.R.T não tem como prever defeitos súbitos, como um chip estourado na placa lógica, por causa de um pico de tensão, mas ele faz um bom trabalho em alertar sobre o risco de defeitos mecânicos.
Todos os HDs atuais oferecem suporte ao S.M.A.R.T. Você pode acompanhar o relatório através de programas como o HDTune (http://www.hdtune.com/) e o SmartExplorer (http://adenix.net/downloads.php), ambos freeware, ou o daemon smartmontools (http://smartmontools.sourceforge.net/), no Linux.
Estes programas mostram uma série de atributos relacionados ao HD, como neste screenshot do HDTune:
Em um HD saudável (mesmo em um HD que já tenha dois anos de uso ou mais), todos atributos devem receber o Status "ok", indicando que estão dentro da faixa de tolerância especificada pelo fabricante.
Quando qualquer um dos atributos passa a apresentar a flag "failed", é hora de fazer backup dos dados e trocar de HD, já que a possibilidade de falha passa a ser muito grande. Se ainda não houver muitos sintomas aparentes, você pode até aproveitar o HD em algum micro sem muita importância (usado apenas para navegar, por exemplo), mas não o utilize mais para guardar dados importantes.
Cada atributo possui quatro valores. O "Current" é o valor atual, enquanto o "Worst" é a pior medição já obtida (na maioria dos casos ambos são iguais, já que a maioria dos valores vai decaindo progressivamente), ambos indicados na forma de um valor decrescente. A coluna "Threshold", por sua vez, indica o limite mínimo, estabelecido pelo fabricante.
A quarta coluna (Data) mostra a informação em valores absolutos (geralmente crescente). Por exemplo, no screenshot, o "Start/Stop Count" (que indica quantas vezes o HD foi ligado e desligado) está em "213" e o "Power On Hours Count" (quantas horas o HD já permaneceu ligado) está em "454", indicando que se trata de um HD semi-novo.
A coluna "Data" da opção "Raw Read Error Rate" indica o número de erros de leitura, enquanto a "Reallocated Event Count" indica o número de badblocks remapeados. Qualquer aumento constante nos dois valores é uma indicação de envelhecimento da mídia ou (em casos mais extremos) danos às cabeças de leitura.
As opções "Throughput Performance" (o desempenho bruto do HD) e "Seek Time Performance" (o tempo de acesso) são indicativos do desempenho relativo do HD (por isso ambas estão com o valor "100" na coluna Current do screenshot, indicando que as medições estão normais). Reduções nestes dois valores indicam desgaste do motor de rotação, ou do sistema de movimentação dos braços de leitura.
Em ambos os casos, os valores vão mudando lentamente, permitindo que você acompanhe o desgaste do HD e possa planejar o próximo upgrade ou substituição muito antes dos alarmes começarem a disparar. Sai sempre muito mais barato fazer backup e trocar o HD quando ele começa a apresentar sinais do problemas do que ter que recorrer a uma empresa de recuperação depois que o desastre já aconteceu.