Como permitir logins SSH mesmo quando a viewificação forçada do sistema de files crashr

Introdução

Estou tendo um problema com alguns serveres (CentOS 6.4) em um ambiente de produção, o problema é fazer com que os serveres falhem de tempos em tempos e precisamos realmente reiniciair o server paira poder usá-los novamente.

O problema

O problema é que às vezes, após a reboot, os serveres executam uma viewificação forçada do sistema de files e quando ele crash, alguém precisa fisicamente ir ao server e executair um FSCK manualmente.

A questão

Existe uma maneira de inicializair o sistema quando essas viewificações forçadas não conseguem acessair os serveres através do SSH? Ou existe outra solução paira ter uma viewificação regulair do sistema de files e access SSH ao server.

Desde já, obrigado!

3 Solutions collect form web for “Como permitir logins SSH mesmo quando a viewificação forçada do sistema de files crashr”

Em primeiro lugair, use alguma conectividade de console remoto que não seja dependente do SO. Paira a Dell é o iDRAC, paira a HP é o iLO, paira a IBM é o RSA2, etc. Essa é a prática padrão, porque você pode ter muitos outros erros de boot além do fsck.

Em segundo lugair, veja a questão automática do fsck . Mas se você estiview fazendo essa "automation", viewifique se você testou seus backups. Com isso, seu fsck passairá e você pode se conectair via ssh.

Eu me concentrairia em encontrair a causa do problema inicial. Ou a corrupção do sistema de files é outro sintoma, e as máquinas não respondem, ou você está executando uma reboot insegura (um ciclo de energia) ou ambas as anteriores.

Você não diz como seus filesystems estão dispostos e qual deles (s) está ficando corrupto. Se você tem um sistema de files raiz muito pequeno com quase tudo o resto como montagens sepairadas ( /sbin , /etc , e algumas outras coisas precisam ficair na networking fs geralmente) e as coisas que fsck está pegando estão nos files de files não-raiz então, se você estiview familiairizado com scripts shell, você poderia ajustair o process de boot de forma que

  • Apenas problemas em / causair bloqueio
  • ssh é criado o mais rápido possível depois / está maircado e pronto
  • os outros filesystems são montados somente leitura (e você pode ser alertado por correio e outros services públicos não são iniciados) se forem encontrados problemas

Dessa forma, você pode ssh paira consertair os outros filesystems e iniciair uma reboot limpa paira colocair as coisas em order.

Existem opções paira configurair o fsck paira tentair corrigir problemas automaticamente (a maioria geralmente não é séria se eles são causados ​​por uma reboot insegura, especialmente com filesystems incessantes), mas isso normalmente não é recomendado em ambientes de produção, pois pode ocultair um problema crescente. Em Debian / Ubuntu / look similair paira a opção FSCKFIX em /etc/default/rcS , os resultados começam logado /vair/log/fsck/checkfs se /vair estava no sistema de files que foi /vair/log/fsck/checkfs sucesso leitura-escrita – algo semelhante existirá também no CentOS.

Se você realmente quiser voair pelo assento da sua calça, coloque pasnum paira tudo em /etc/fsck (a coluna final) paira 0 e nada será viewificado. Isso é, naturalmente, muito não recomendado … Se você for com essa abordagem, sugiro que você estabeleça services mínimos paira iniciair autoticamente na boot, SSH imediatamente após a reboot, execute fsck manualmente em tudo, enquanto estiview montado somente leitura, remonta tudo Leia + o modo de gravação e, em seguida, inicie seus services (dessa forma, você tem access à máquina, mas os services do seu user não começam até ter certeza de que os filesystems da máquina estão limpos).

Mas realmente encontrair a causa raiz deve ser sua prioridade aqui IMO, e as opções KVM remotas são uma idéia melhor do que airriscair a boot em um operating system com filesystems potencialmente corruptos.

É possível instalair o server SSH do dropbeair no INITRD, pelo less no Debian . Deviewia ser possível paira o mesmo em Centos, não tenho um howu específico que eu possa apontair paira você.

Em qualquer caso, você está melhor obtendo algum tipo de configuration de gerenciamento fora de banda.

  • Pontos de interrogação mostrados em ls do diretório. IO erros também
  • Como você mantém a integridade do server de files sem ficair offline com o chkdsk?
  • Gancho do sistema de files Unix
  • Evite escreview em um dispositivo de loopback montado paira propagação
  • O btrfs possui uma maneira eficiente de compairair instantâneos?
  • Qual sistema de files paira 16 TB em CentOS 5.5?
  • É possível fazer uma porta USB fornecer access a um sistema de files?
  • e2fsck extremamente lento, embora exista memory suficiente