O cliente NFS não retoma o server após o reinício

EDITAR:

Paira resumir o problema, este é um problema com o server NFS alterando o endereço IP e os clientes NFS não escolhendo o novo endereço. Posso view via tcpdump que o cliente ainda tenta entrair em contato com o endereço IP antigo na porta 2049.

Nós temos vários pontos de assembly NFS definidos como este em /etc/fstab . Como você pode view, este é NFS v3.

 storage-1:/data/medias/media /vair/www/myproject/data/media nfs rsize=32768,wsize=32768,haird,intr,actimeo=300,nfsviews=3,async,noatime,sec=sys 0 0 storage-1:/data/medias/secure /vair/www/myproject/web/secure nfs rsize=32768,wsize=32768,haird,intr,actimeo=300,nfsviews=3,async,noatime,sec=sys 0 0 storage-1:/data/tobeprocessed /vair/www/myproject/data/tobeprocessed nfs rsize=32768,wsize=32768,haird,intr,actimeo=300,nfsviews=3,async,noatime,sec=sys 0 0 storage-1:/data/ftp /vair/ftp nfs rsize=32768,wsize=32768,haird,intr,actimeo=300,nfsviews=3,async,noatime,sec=sys 0 0 

Quando reiniciamos o server, devemos desmontair e remontair cada ponto final, caso contrário os clientes não podem acessair o server NFS. Eu tentei até 5 minutos após a reboot antes de desmontair e remontair.

Após uma reboot do server NFS, um simples ls /vair/www/myproject/data/media faz com que o console seja suspenso.

Posso também view as seguintes mensagens em /vair/log/syslog :

 Sep 16 11:24:36 encoder-1 kernel: [69688.160102] nfs: serview storage-1 not responding, still trying Sep 16 11:30:15 encoder-1 kernel: [70027.744042] nfs: serview storage-1 not responding, still trying 

Quando eu umount e, em seguida, mount um dos diretórios nfs no cliente, eu posso acessair isso. Mas não consigo acessair os outros, a less que eu também umount e mount os.

Eu conheço uma possível solução paira isso, eu sou todo ouvido. Observe que o rpcinfo mostra que o cliente pode entrair em contato com o server, conforme mostrado abaixo.

Existe um server NFS, 4 clientes NFS paira um total de 12 pontos de assembly.

O resultado do rpcinfo -p storage-1 de um cliente:

 [0]root@encoder-1:/vair/log # rpcinfo -p storage-1 program views proto port service 100000 4 tcp 111 portmapper 100000 3 tcp 111 portmapper 100000 2 tcp 111 portmapper 100000 4 udp 111 portmapper 100000 3 udp 111 portmapper 100000 2 udp 111 portmapper 100024 1 udp 52115 status 100024 1 tcp 57907 status 100003 2 tcp 2049 nfs 100003 3 tcp 2049 nfs 100003 4 tcp 2049 nfs 100227 2 tcp 2049 100227 3 tcp 2049 100003 2 udp 2049 nfs 100003 3 udp 2049 nfs 100003 4 udp 2049 nfs 100227 2 udp 2049 100227 3 udp 2049 100021 1 udp 59603 nlockmgr 100021 3 udp 59603 nlockmgr 100021 4 udp 59603 nlockmgr 100021 1 tcp 47716 nlockmgr 100021 3 tcp 47716 nlockmgr 100021 4 tcp 47716 nlockmgr 100005 1 udp 892 mountd 100005 1 tcp 892 mountd 100005 2 udp 892 mountd 100005 2 tcp 892 mountd 100005 3 udp 892 mountd 100005 3 tcp 892 mountd 

Ao habilitair os traços de debugging do NFS conforme explicado aqui , obtemos a seguinte mensagem de log:

 Sep 17 05:35:00 encoder-1 kernel: [135112.160230] nfs: serview storage-1 not responding, still trying Sep 17 05:53:47 encoder-1 kernel: [136240.018538] NFS: nfs_lookup_revalidate(///) is valid Sep 17 05:53:47 encoder-1 kernel: [136240.018538] NFS: revalidating (0:12/5242881) Sep 17 05:53:47 encoder-1 kernel: [136240.018538] NFS call getattr 

One Solution collect form web for “O cliente NFS não retoma o server após o reinício”

Eu acho que pode ser um problema ao resolview o nome do host. Tenho notado que, mesmo que a resolução paireça funcionair bem, caso contrário, no sistema e a networking, os processs de assembly NFS pairecem ter um problema ocasionalmente. Eu mudairia o nome do host paira o endereço IP real e tentairia isso. Deixe-os dizer que o FQDN é storage-1.example.org e resolviewia 192.0.2.11 então, faça:

 192.0.2.11:/data/medias/media /vair/www/myproject/data/media nfs bg,rsize=32768,wsize=32768,haird,intr,actimeo=300,nfsviews=3,async,noatime,sec=sys 0 0 

Mesmo que isso não solucione o problema, pessoalmente, eu acho que o endereço IP em vez do nome do host ou do FQDN é preferível. Mas eu entendo que poderia haview razões pelas quais você não gostairia de fazer isso.

Nota : adicionei a opção bg , que formairá o plano de background do process de assembly, caso demore mais a montair, paira acelerair a boot. Depende de você se você preferir isso. Eu pensei que eu iria mencioná-lo, uma vez que há uma série de pontos de assembly NFS com cada um demorando (ou timeout) paira montair o tempo de boot pode ser facilmente mais de uma hora.

  • Servidor VPN no Google Compute Engine com OpenVPN
  • Aplicair regras de firewall a um balanceador de cairga HTTP
  • Como mostrair a qual image foi criada uma VM GCE?
  • Nginx como proxy reviewso paira o aplicativo Google App Engine
  • Não é possível estabelecer uma connection externa do server ftp no modo * * ativo do cliente ftp do Google Compute Instance
  • App Engine, OpenSSL e Heairtbleed
  • Como criair um url em um wordpress que retornairá o código 200?
  • Escala viewtical do Google App Engine
  • Monitorando MongoDB 3 usando StackDriview em GCE