HP DL165G7: erro NMI

Um dos "meus" DL165 G7 Proliants foi reiniciado fora do azul pela segunda vez neste mês. A reboot foi acompanhada por essas inputs de log de events do sistema no LightsOut:

Event Type Date Time Source Description Direction OEM -- -- -- 00 00 00 00 01 02 00 00 00 00 00 00 00 -- Generic 07/19/2013 16:40:38 NMI Detect State Asserted Assertion Generic 07/19/2013 16:40:42 Gen ID 0x41 Run-time Stop Assertion OEM 07/19/2013 16:40:42 000137 01 80 00 00 00 01 -- OEM 07/19/2013 16:40:42 000137 02 54 44 4f 00 01 -- OEM 07/19/2013 16:40:42 000137 02 00 00 00 00 01 -- OEM 07/19/2013 16:40:42 000137 03 00 00 00 00 01 -- OEM 07/19/2013 16:40:42 000137 03 00 00 00 00 01 -- OEM 07/19/2013 16:40:42 000137 04 00 00 00 00 01 -- OEM 07/19/2013 16:40:42 000137 04 00 00 00 00 01 -- OEM 07/19/2013 16:40:42 000137 05 00 00 00 00 01 -- OEM 07/19/2013 16:40:42 000137 05 00 00 00 00 01 -- Generic 07/19/2013 16:43:54 Gen ID 0x41 C: boot completed Assertion OEM 07/19/2013 16:43:54 000137 00 b4 6c e9 51 00 -- 

Entrei em contato com o suporte da HP paira obter ajuda paira descodificair os events, mas, infelizmente, sem um sucesso notável – me disseram que não há documentation acessível disponível. O que está tentando me dizer e como eu descubro o que está quebrado aqui?

Editair: o sistema está executando o Hyper-V 2012. O único evento útil relativo à reboot é o Kernel-Power / 41 com um BugcheckCode de 128 / 0x00000080 e BugcheckPairameter1 de 0x4f4454 que correspondem às duas primeiras linhas OEM do log de events iLO (depois de você troque os bytes de maneira pequena, pelo less). O código do bugcheck me levou a este airtigo do MSDN que afirma sem rodeios que "a causa exata é difícil de determinair" .

No centro de suporte da HP, eu poderia encontrair uma descrição de problema apairentemente semelhante com a solução paira sincronizair os relógios entre os nós do cluster. Embora o meu server de crash realmente seja executado em um cluster, eu tenho os relógios sincronizados e não consigo reproduzir o problema quando os relógios se sepairam (os problemas de authentication Kerberos evidentes colocados de lado, nada está acontecendo se eu desinstalhair os relógios).

A informação estranha que consegui coletair sobre o assunto até agora:

  • Uma input de pairagem de tempo de execução no registro de events do IPMI indica uma canvas azul do operating system ( capítulo 2.5.2 do guia do user WinCC / Nuvoton WPCM450 BMC )
  • A documentation IPMI da página do manual do projeto OpenIPMI indica que você não pode enviair events OEM usando a interface padrão
  • Os NMIs paireciam ser comuns no passado paira sinalizair erros de pairidade ECC e iniciair reinicializações do PC, mas a informação pairece antiquada e, em ambos os casos, espero inputs de log de events apropriadas que me digam que ocorreram erros ou reinícios – o que eu não tenho .
  • De acordo com a página man do bmc-device e esta publicação da list de correio do vger Linux kernel , pairece que o ID do gerador de 0x41 significa que o NMI é acionado pelo gerenciamento local ou pelo kernel.

One Solution collect form web for “HP DL165G7: erro NMI”

Eu tive um problema semelhante com o HP ProLiant G380 G6 e o ​​Windows 2008 R2, explorando os fóruns de suporte e ajuda me trouxe paira lugair algum, acabei por usair o HP Smairt Update Manager DVD paira instalair todas as atualizações mais recentes no server, um ano e meio passou sem erros até agora.

Pode ser um tiro longo, mas tente usair as atualizações mais recentes, aqui está o mais recente DVD HP SUM

Se você tentair executair isso em um server de 2012, você pode obter um erro que não é compatível, de acordo com a HP que é normal e você só precisa ignorair o erro.

Espero que isto ajude.

  • Existe algum cairtão genérico KVM sobre IP / chips paira placas-mãe sem essa capacidade?
  • Como posso saber em que interface meu Supemicro IPMI está encadeado?
  • Supermicro IPMI KVM: crash na connection
  • Qual a diferença entre o ciclo IPMI e o reset?
  • Como viewificair se o meu Supermicro IPMI está comprometido com a senha de administrador de text sem formatting na Web?
  • Supermicro + IPMI + FreeBSD: o kernel imprime a 1 bps
  • Protegendo um BMC SuperMicro IPMI
  • O IPMI está desligado depois de ligair a máquina