Какие документы по обработке ошибок в распределенных системах вы рекомендуете?
Какие документы по обработке ошибок в распределенных системах вы рекомендуете?
Ответы:
Возможно, вы захотите взглянуть на работы, которые получили в 2010 году премии Тушара Д. Чандры, Вассоса Хадзилакоса и Сэма Тоуга « Эдсгер В. Дейкстра» :
Эти документы вводят понятие детекторов отказов в распределенной системе в общем и точном контексте. Интуитивно они пытались изучить минимальное количество информации об ошибках, необходимой для достижения консенсуса. Оказывается, вам не нужен идеальный детектор отказов для достижения консенсуса. Для этой задачи будет достаточно даже ненадежных детекторов отказов, удовлетворяющих определенным минимальным условиям. Эти документы очень повлияли на то, как бороться со сбоями в распределенных системах.
Какие сбои в системе? Вы ищете решения для обработки византийских сбоев или просто классическую модель аварийного останова? Решения при наличии византийских узлов в распределенной системе - более интригующая проблема. Эта проблема была формализована Лесли Лампортом (проблема византийских генералов), а в статье Барбары Лисков и Мигеля Кастро за 1999 год представлено наиболее близкое практическое практическое решение «Практическая византийская отказоустойчивость». Оригинальные формальные модели для работы с отказоустойчивостью включают Машинный подход Фреда Шнайдера и репликация с печатью вида Я согласен с тем, что вопрос очень общий, поле огромно, и теория составляет основу большинства систем, работающих сегодня онлайн. Может быть, более конкретная модель ошибок и проблемная область помогут получить лучшие ответы
Вот коллекция шаблонов для обработки ошибок в распределенных системах:
В качестве альтернативы для более общей работы предлагается книга Rachid Guerraoui и Luis Rodrigues « Введение в надежное распределенное программирование », в которой представлен широкий спектр практических алгоритмов, включая множество вариантов восстановления после сбоев. Более классический текст « Распределенные алгоритмы » Нэнси Линч охватывает аналогичную основу с более теоретической точки зрения.