У меня есть несколько виртуальных машин в Windows Azure, на которых работает наш веб-сайт электронной коммерции, и в последнее время мы начали использовать Telegraf, InfluxDb и Grafana, чтобы следить за этими машинами. После пары недель сбора данных я заметил странную закономерность, связанную с метрикой доступной памяти :
Каждый день, почти всегда в один и тот же период дня, я замечал, что высвобождается внезапное количество памяти, которое из-за моих очень очень очень ограниченных навыков DevOp я не могу понять, что является причиной этого.
Вот диаграмма, которая показывает этот шаблон:
Мой вопрос: что может привести к чему-то подобному? У меня возникает соблазн подозревать, что виновата утечка памяти, но ... Свободная память никогда не опускается ниже 70%, а происходит только на двух виртуальных машинах с наибольшим трафиком!
Должен ли я быть обеспокоен, когда я вижу что-то подобное?
PS: я просмотрел сбор метрик для частных и виртуальных байтов для каждой из запущенных нами служб Windows и для процесса w3wp ... хотя я читал, что эти метрики не очень надежны, чтобы выяснить, есть ли у вас утечка памяти, но, по крайней мере, я постараюсь получить какую-то тенденцию и посмотреть, соответствует ли она шаблону, показанному выше.