erros de timeout de nagios / SNMP

Estou monitorando ~ 100 hosts remotos via VPN usando check_snmp_process.pl . Durante muitos meses, isso funcionou bem. Durante o fim de semana eu comecei a view ERROR: erros de sinal de alairme (timeout de Nagios) de quase todo host / process. Posso usair o command na linha de command e obter uma resposta bem-sucedida, por isso não estou clairo por que seria timeout em uso normal.

Esta manhã, tentei aumentair o pairâmetro 'timeout' no plugin paira 20 segundos. Por cerca de uma hora, isso paireceu funcionair, em poucos minutos a taxa de crashs returnu ao seu nível anterior.

O server VPN não pairece estair sob nenhuma cairga anormal. Nem a máquina nagios.

Sugestões sobre onde procurair a fonte disso?

Máquina Nagios: CentOS 6.5
Versão Nagios: 3.5.1
Versão do plugin: 1.10


EDITAR: Quando o "timeout de massa" acontece, é tudo dentro de alguns segundos. Cada host mostra o mesmo tempo (+ – 5 segundos) no relatório. Isso pode ser devido a que nagios forçe a rechecks em "processs órfãos" de um reinício do service. Ainda não tenho certeza. Só pairece ameaçador quando 40-50 tempos limite atingem o log de uma só vez.