Это иногда случается, когда Amazon пытается списать физический сервер, на котором работает ваш экземпляр. Возможно, они убивают сервер, чтобы заменить неисправный аппаратный компонент, или сервер просто достиг конца срока службы. В любом случае, насколько я понимаю, их процесс работает примерно так:
- Физический сервер помечается как списанный, поэтому на нем не запускаются новые экземпляры.
- Если они могут (например, они не имеют дело с критическим аппаратным сбоем), Amazon подождет некоторое время, чтобы увидеть, если экземпляры, работающие на сервере, выключатся или перезагрузятся самостоятельно (перезагрузка экземпляра EC2 обычно приводит к тому, что он получает запущен на другом физическом сервере).
- По истечении этого периода Amazon заставит оставшиеся экземпляры перезагрузиться, перенеся их на другие физические серверы.
Как правило, из-за этой и других странностей в среде вы должны рассматривать любой отдельный сервер, работающий на EC2, как Ephemeral. Любой сервер может перезагрузиться или полностью исчезнуть в любое время. Соответственно, автоматизация развертывания с помощью чего-то вроде шеф-повара или марионетки , тщательного мониторинга и разработки приложения для устранения сбоев имеет решающее значение.