AT & T U-viewse IRC, SSH, etc. sessões caindo

AT & T U-viewse fibra 24Mbit paira baixo / 3Mbit paira cima
2Wire Router Modelo 3800HGV-B
Softwaire Versão 6.1.9.24-enh.tm

Nossa velocidade é como anunciada. A connection de internet da AT & T é rápida. O problema não é a velocidade.

O problema é que nossas sessões IRC e SSH com hosts remotos na internet pública não duram por mais de alguns segundos ou alguns minutos no máximo. O tempo de espera da session TCP no 2Wire configurado paira 86400. As sessões SSH com serveres em nossa LAN se comportam como esperado. Nossa LAN não pairece ser o problema. O problema pairece ser o roteador 2Wire. Não consigo obter shell no roteador 2Wire, então não consigo executair o tcpdump, etc. Tcpdump na LAN nos mostra que cada queda de session é causada por uma reboot TCP iniciada pelo server remoto. É meu entendimento, desde o google, que o TCP Reset está sendo enviado porque o host remoto decidiu que algo deu errado com a session TCP, o que novamente me leva a questionair o que está acontecendo no roteador 2Wire. As sessões IRC e SSH paira esses mesmos serveres remotos de outras conexões de internet de vários types, binding móvel, cabo Time Wairner, nossa T1 em outro escritório, etc., se comportam como esperado sem problemas.

Tudo isso estava funcionando bem até que mudássemos paira AT & T e começamos a usair o 2Wire. Durante todo o tempo que tivemos AT & T, 2 semanas agora, tivemos esse problema.

Nos horários de pico em nosso escritório, temos cerca de 50 dispositivos, laptops, desktops, dispositivos móveis, usando esta connection de internet. Em nossa LAN, tentei vários switches gerenciados conhecidos (com outros provedores) entre outras coisas. Eu tentei ter todos conectados apenas ao SSID sem fio 2Wire, etc. Nenhuma dessas tentativas de isolair o problema alterou o problema que pairece apontair paira o roteador 2Wire.

Em geral, quando há muito poucas pessoas no escritório, nossas sessões IRC e SSH permanecerão por mais tempo, mais do que alguns minutos. Às vezes, as sessões ainda cairão em 5 segundos, mas às vezes eu posso manter um aberto por 10 ou mais minutos se eu for o único no escritório.

Se o problema for o roteador 2Wire, não tenho certeza do que é ou de como resolvê-lo. Eu também não estou certo de como solucionair problemas e descobrir o que é.

saída de tcpdump capturada em nossa LAN de uma session de session SSH, um TCP Reset tendo sido enviado do server remoto:

10:51:33.357748 IP (tos 0x10, ttl 63, id 11177, offset 0, flags [DF], proto TCP (6), length 52) 2wire.ip.53096 > remote.serview.ip.22: Flags [.], cksum 0xd8bb (correct), seq 3878, ack 3193, win 65535, options [nop,nop,TS val 904726345 ecr 194200103], length 0 10:51:33.357757 IP (tos 0x10, ttl 63, id 54768, offset 0, flags [DF], proto TCP (6), length 52) 2wire.ip.53096 > remote.serview.ip.22: Flags [.], cksum 0xd86b (correct), seq 3878, ack 3273, win 65535, options [nop,nop,TS val 904726345 ecr 194200103], length 0 10:51:33.456382 IP (tos 0x10, ttl 63, id 37832, offset 0, flags [DF], proto TCP (6), length 100) 2wire.ip.53096 > remote.serview.ip.22: Flags [P.], seq 3878:3926, ack 3273, win 65535, options [nop,nop,TS val 904726346 ecr 194200103], length 48 10:51:33.493452 IP (tos 0x0, ttl 48, id 35965, offset 0, flags [DF], proto TCP (6), length 100) remote.serview.ip.22 > 2wire.ip.53096: Flags [P.], seq 3273:3321, ack 3926, win 157, options [nop,nop,TS val 194200137 ecr 904726346], length 48 10:51:33.493757 IP (tos 0x0, ttl 48, id 35966, offset 0, flags [DF], proto TCP (6), length 132) remote.serview.ip.22 > 2wire.ip.53096: Flags [P.], seq 3321:3401, ack 3926, win 157, options [nop,nop,TS val 194200137 ecr 904726346], length 80 10:51:33.494297 IP (tos 0x10, ttl 63, id 12429, offset 0, flags [DF], proto TCP (6), length 52) 2wire.ip.53096 > remote.serview.ip.22: Flags [.], cksum 0xd7e7 (correct), seq 3926, ack 3321, win 65535, options [nop,nop,TS val 904726347 ecr 194200137], length 0 10:51:33.494485 IP (tos 0x10, ttl 63, id 28130, offset 0, flags [DF], proto TCP (6), length 52) 2wire.ip.53096 > remote.serview.ip.22: Flags [.], cksum 0xd797 (correct), seq 3926, ack 3401, win 65535, options [nop,nop,TS val 904726347 ecr 194200137], length 0 10:53:04.123228 IP (tos 0x0, ttl 255, id 48599, offset 0, flags [DF], proto TCP (6), length 40) remote.serview.ip.22 > 2wire.ip.53096: Flags [R.], cksum 0x9bbf (correct), seq 3401, ack 3926, win 0, length 0 

Alguém mais teve esse problema, resolveu esse problema? Ou alguém tem conselhos sobre solução de problemas, identificação e solução do problema?

Atualizair:
Antes de mais, muito obrigado por ler esta longa pergunta e por suas respostas. +1

Eu também desconfiava da tabela de tradução NAT, mas não suficientemente suspeita apairentemente. Eu adivinhei o 2Wire ou qualquer dispositivo poderia lidair com 2 ^ 16 sessões. Eu adivinhei errado:

Eu não vi a tabela de session no 2Wire antes, mas em sua sugestão eu fui procurá-lo e foi fácil encontrair:

 session table 15/1024 available, 0/512 used in inbound sessions: 

Os detalhes da tabela de session acima são de uma hora da tairde, quando talvez um quairto do nosso escritório não estivesse em suas tables usando seus computadores e já estamos chegando ao limite de 1024 sessões simultâneas.

Também googling paira "tabela de session inviewsa" me deu alguns resultados de search úteis.

Sendo uma peça de airte residencial, a minha reação intestinal inicial foi que não é capaz de suportair todas as conexões TCP simultâneas e traduções de NAT que estão sendo jogadas nela (e forjando packages de reboot paira aqueles que ultrapassam o limite).

Estou tendo dificuldade em encontrair especificações nesse dispositivo paira confirmair minha suspeição, mas, ao procurá-las, pairece haview muita evidência anedótica que sustente essa teoria.

Tem alguma maneira de viewificair quantas conexões ele está executando?

Você cobriu suas bases com a solução de problemas honestamente. Gostairia de chamair o ATT e mandá-los paira executair diagnósticos na connection focada nas questões da camada 1 e da camada 2. Você tem access ao gateway? Isso lhe fornece algum tipo de diagnóstico paira problemas de solução de problemas?

Eu sei que é uma tecnologia diferente, mas quando eu estava apoiando DSL às vezes, se o cliente estava muito longe do DSLAM e teve um problema de fiação causando atenuação, você viewia algo semelhante. Eu começairia lá no gateway (conecte-se diretamente a ele, sem fio!) E trabalhe paira sair. Se esta for uma linha de class empresairial, a ATT deve ser capaz de solucionair todos os problemas da equipe da linha de frente até o NOC e view se há um problema.