Есть ли литература, перечисляющая характеристики алгоритмов, которые позволяют их объяснять?
Единственная литература, о которой я знаю, это недавняя статья Риберо, Сингха и Гестрина. Сначала они определяют объяснимость одного прогноза:
Под «объяснением предсказания» мы подразумеваем представление текстовых или визуальных артефактов, которые обеспечивают качественное понимание взаимосвязи между компонентами экземпляра (например, словами в тексте, заплатками на изображении) и предсказанием модели.
Авторы далее уточняют, что это означает для более конкретных примеров, а затем используют это понятие для определения объяснимости модели. Их цель состоит в том, чтобы попытаться, так сказать, искусственно добавить объяснимость к другим непрозрачным моделям, а не сравнивать объяснимость существующих методов. Документ может быть полезен в любом случае, так как он пытается ввести более точную терминологию вокруг понятия «объяснимость».
Существуют ли общепринятые модели машинного обучения, представляющие хороший компромисс между ними?
Я согласен с @Winter, что упругая сеть для (не только логистической) регрессии может рассматриваться как пример хорошего компромисса между точностью предсказания и объяснимостью.
Для другого типа области приложения (временные ряды) другой класс методов также обеспечивает хороший компромисс: Байесовское структурное моделирование временных рядов. Он наследует объяснимость от классического структурного моделирования временных рядов, а некоторую гибкость от байесовского подхода. Как и в случае логистической регрессии, объяснению помогают регрессионные уравнения, используемые для моделирования. Смотрите эту статью для хорошего применения в маркетинге и дальнейших ссылок.
Что касается только что упомянутого байесовского контекста, вы также можете взглянуть на вероятностные графические модели. Их объяснимость основана не на уравнениях регрессии, а на графических способах моделирования; см. «Вероятностные графические модели: принципы и методы» Коллера и Фридмана для большого обзора.
Я не уверен, можем ли мы ссылаться на байесовские методы выше как на «общепринятый хороший компромисс». Они могут быть недостаточно известны для этого, особенно по сравнению с примером эластичной сетки.