Previous Entry Share Next Entry
2016-01

мир открытий чудных

новый прекрасный подземный стук в продакшне: как выяснилось, после gradual ребута кластера у одного из серверов стало на 64 гб оперативки меньше.

мониторить ЭТО нам в голову не приходило, да... точнее, мониторинг был, а вот алерта не было.

This entry was originally posted at https://wizzard.dreamwidth.org/490770.html. It has comment count unavailable comments. Please comment there using OpenID.

  • 1
amarao_san April 3rd, 15:56
Если сервер брендовый, 99%, что про это есть запись в SEL'е. Вы же мониторите SEL, правда?

wizzard0 April 3rd, 16:37
есть, есть, там даже написано что сдох контроллер а не планки. но алерты были на предмет стораджа, сетевух и как ни странно процов. а тут сторадж есть, процы есть, сеть есть, а памяти есть часть :)

Edited at 2018-04-03 04:37 pm (UTC)

  • 1
?

Log in

No account? Create an account