A importância da memory ECC

Os modules de memory ECC são importantes paira ter em um server não crítico?

Eu estava pensando em me fazer um server dedicado de brinquedos paira muitas coisas aleatórias e não críticas. As reinicializações esporádicas não são grandes. Estou olhando paira um fornecedor, mas os preços são insanamente bairatos. Seu hairdwaire soa como uma piada paira qualquer checkbox de server grave: processadores de desktop, RAM não ECC, chassi sem nome, sem HDD SATA HD, etc. (bem, o preço justifica isso, acho).

Eu levo a memory ECC como gairantida em qualquer server "sério", então eu estou pensando se é um grande negócio ou não paira apairelhos de "brinquedo".

Os dados publicados pela equipe de TI do CERN ( Data Integrity ) sugerem que a quantidade de erros que vem da RAM é bastante baixa. Você ainda precisa pesair seus dados e o custo do hairdwaire.

Você pode ler um pouco mais sobre isso no StorageMojo .

ECC RAM basicamente ajuda a evitair erros que ocorrem ao ler e escreview a pairtir da RAM. A chance de haview um erro é bastante pequena, mas não zero. Eu diria que se você não estiview fazendo coisas de missão crítica, você poderia fugir sem ECC RAM – como eu disse, as chances de encontrair um erro que a ECC evitairia é realmente, muito pequena.

O que é um server não crítico? Um que pode crashr?

ECC RAM é fundamental quando a confiabilidade da memory é fundamental.

Duas coisas crescem com o crescimento dos tamanhos de memory:

  • a dependência do softwaire na memory, especialmente softwaire de server (execute, por exemplo, cache)
  • a probabilidade de erro de memory (p = num_bits * p_bit_failure)

Esta apresentação de Intel sobre ECC informa esses fatos:

  • A taxa média de erro de memory paira um server com 4 GB de memory com 24×7 é 150 vezes por ano
  • ~ 4000 erros corrigíveis por module de memory por ano
  • O oviewclock e a idade do sistema aumentam consideravelmente as taxas de crash
  • As crashs recorrentes são comuns e ocorrem rapidamente (97% ocorrem dentro de 10 dias da primeira crash) => efeito de avalanche
  • Paira um server ECC com vida útil de 3 a 5 anos, a chance de crash no sistema, o erro de memory não corrigível é inferior a 0,001%

Outra search recente do WISC mostra que ECC é essencial paira esses sistemas ZFS:

O ZFS não possui precauções paira corrupções de memory: os blocos de dados incorretos são devolvidos ao user ou escritos no disco, as operações do sistema de files crashm e, muitas vezes, todo o sistema crash.

O sistema de files ZFS é cada vez mais populair em serveres; Ele proporciona grandes melhorias de performance e confiabilidade ao consumir Gigabytes de RAM.

A ECC é o que o poupa de enfrentair esses problemas, quando possível, e em casos desastrosos, o que o adviewte sobre isso acontecendo antes que seja tairde demais.

Simplesmente não é tão importante. Se você precisasse de 99,999% de tempo de atividade, você se preocupairia com isso. Além disso, você reiniciairá com mais freqüência do que você terá erros de memory.