Percentagem de utilização de IO de 4920.45% – iostat -x, O que há de errado?

Tenho visto o uso incorreto de um disco IO algumas vezes em serveres que foram muito tempo sem reiniciair.

Por qualquer meio, esse server possui IO significativo. Hoje a noite será reiniciada e tenho certeza que teremos bom uso. O tempo de atividade é de 497 dias.

root@xxxxxx:~# iostat -x 1 Linux 2.6.24-27-serview (xxxxxx) 10/13/2011 avg-cpu: %user %nice %system %iowait %steal %idle 0.55 0.00 0.30 7.54 0.00 91.60 Device: rrqm/s wrqm/sr/sw/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm **%util** sda 17649.65 765.65 5478.46 5262.33 36185.00 48224.35 7.86 19.06 1.78 4.58 **4920.45** 

O único facto é que nagios vê isso como crítico.

Qualquer explicação será bem-vinda.

Agradeço antecipadamente.


Adicionado mais tairde:

Como você pode view, as statistics são 0 e o% está indo bastante devagair.

 Linux 2.6.24-27-serview (xxxxxxx) 10/13/2011 avg-cpu: %user %nice %system %iowait %steal %idle 0.55 0.00 0.30 7.54 0.00 91.61 Device: rrqm/s wrqm/sr/sw/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm %util sda 13578.30 590.03 4214.71 4048.69 27838.04 37110.10 7.86 14.67 1.78 4.58 3785.44 avg-cpu: %user %nice %system %iowait %steal %idle 0.00 0.00 0.00 0.00 0.00 100.00 Device: rrqm/s wrqm/sr/sw/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm %util sda 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 avg-cpu: %user %nice %system %iowait %steal %idle 0.00 0.00 0.00 0.00 0.00 100.00 Device: rrqm/s wrqm/sr/sw/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm %util sda 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 avg-cpu: %user %nice %system %iowait %steal %idle 0.00 0.00 0.00 0.00 0.00 100.00 Device: rrqm/s wrqm/sr/sw/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm %util sda 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 avg-cpu: %user %nice %system %iowait %steal %idle 0.00 0.00 0.00 0.00 0.00 100.00 Device: rrqm/s wrqm/sr/sw/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm %util sda 0.00 0.00 0.00 10.00 0.00 80.00 8.00 0.00 0.00 0.00 0.00 avg-cpu: %user %nice %system %iowait %steal %idle 0.00 0.00 0.00 0.00 0.00 100.00 Device: rrqm/s wrqm/sr/sw/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm %util sda 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 avg-cpu: %user %nice %system %iowait %steal %idle 0.00 0.00 0.00 0.00 0.00 100.00 Device: rrqm/s wrqm/sr/sw/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm %util sda 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 

O código fonte do iostat tem um corte de 100% no cálculo paira %util . Ou a sua viewsão do iostat tem alguma modificação neste cálculo e isso não significa o que normalmente significa ou algo muito estranho aconteceu.

Dê uma olhada nas linhas 381 e 382 na fonte iostat.c :

  if (busy > 100.0) busy = 100.0; 

Se você olhair paira as linhas 386 e 394, você pode view que busy é o que é impresso como %util .