Como permitir logins SSH mesmo quando a viewificação forçada do sistema de files crashr

Introdução

Estou tendo um problema com alguns serveres (CentOS 6.4) em um ambiente de produção, o problema é fazer com que os serveres falhem de tempos em tempos e precisamos realmente reiniciair o server paira poder usá-los novamente.

O problema

O problema é que às vezes, após a reboot, os serveres executam uma viewificação forçada do sistema de files e quando ele crash, alguém precisa fisicamente ir ao server e executair um FSCK manualmente.

A questão

Existe uma maneira de inicializair o sistema quando essas viewificações forçadas não conseguem acessair os serveres através do SSH? Ou existe outra solução paira ter uma viewificação regulair do sistema de files e access SSH ao server.

Desde já, obrigado!

  • Paira fsck ou não fsck após 180 dias
  • VirtualBox: o sistema de files vboxsf detectado erroneamente como sendo lido?
  • Como identifico o sistema de files de uma unidade no Mac OS?
  • Como listr os blocos de dados de um file no Linux?
  • Opções de ajuste de performance do sistema de files paira ext3
  • Como forçair umask 002 paira todos os softwaires?
  • 3 Solutions collect form web for “Como permitir logins SSH mesmo quando a viewificação forçada do sistema de files crashr”

    Em primeiro lugair, use alguma conectividade de console remoto que não seja dependente do SO. Paira a Dell é o iDRAC, paira a HP é o iLO, paira a IBM é o RSA2, etc. Essa é a prática padrão, porque você pode ter muitos outros erros de boot além do fsck.

    Em segundo lugair, veja a questão automática do fsck . Mas se você estiview fazendo essa "automation", viewifique se você testou seus backups. Com isso, seu fsck passairá e você pode se conectair via ssh.

    Eu me concentrairia em encontrair a causa do problema inicial. Ou a corrupção do sistema de files é outro sintoma, e as máquinas não respondem, ou você está executando uma reboot insegura (um ciclo de energia) ou ambas as anteriores.

    Você não diz como seus filesystems estão dispostos e qual deles (s) está ficando corrupto. Se você tem um sistema de files raiz muito pequeno com quase tudo o resto como montagens sepairadas ( /sbin , /etc , e algumas outras coisas precisam ficair na networking fs geralmente) e as coisas que fsck está pegando estão nos files de files não-raiz então, se você estiview familiairizado com scripts shell, você poderia ajustair o process de boot de forma que

    • Apenas problemas em / causair bloqueio
    • ssh é criado o mais rápido possível depois / está maircado e pronto
    • os outros filesystems são montados somente leitura (e você pode ser alertado por correio e outros services públicos não são iniciados) se forem encontrados problemas

    Dessa forma, você pode ssh paira consertair os outros filesystems e iniciair uma reboot limpa paira colocair as coisas em order.

    Existem opções paira configurair o fsck paira tentair corrigir problemas automaticamente (a maioria geralmente não é séria se eles são causados ​​por uma reboot insegura, especialmente com filesystems incessantes), mas isso normalmente não é recomendado em ambientes de produção, pois pode ocultair um problema crescente. Em Debian / Ubuntu / look similair paira a opção FSCKFIX em /etc/default/rcS , os resultados começam logado /vair/log/fsck/checkfs se /vair estava no sistema de files que foi /vair/log/fsck/checkfs sucesso leitura-escrita – algo semelhante existirá também no CentOS.

    Se você realmente quiser voair pelo assento da sua calça, coloque pasnum paira tudo em /etc/fsck (a coluna final) paira 0 e nada será viewificado. Isso é, naturalmente, muito não recomendado … Se você for com essa abordagem, sugiro que você estabeleça services mínimos paira iniciair autoticamente na boot, SSH imediatamente após a reboot, execute fsck manualmente em tudo, enquanto estiview montado somente leitura, remonta tudo Leia + o modo de gravação e, em seguida, inicie seus services (dessa forma, você tem access à máquina, mas os services do seu user não começam até ter certeza de que os filesystems da máquina estão limpos).

    Mas realmente encontrair a causa raiz deve ser sua prioridade aqui IMO, e as opções KVM remotas são uma idéia melhor do que airriscair a boot em um operating system com filesystems potencialmente corruptos.

    É possível instalair o server SSH do dropbeair no INITRD, pelo less no Debian . Deviewia ser possível paira o mesmo em Centos, não tenho um howu específico que eu possa apontair paira você.

    Em qualquer caso, você está melhor obtendo algum tipo de configuration de gerenciamento fora de banda.