Когда мы читаем книгу, понимание обозначений играет очень важную роль в понимании содержания. К сожалению, разные сообщества имеют разные условные обозначения для формулировки модели и задачи оптимизации. Может ли кто-нибудь суммировать некоторые обозначения формулировки здесь и указать возможные причины?
Я приведу здесь пример: в литературе по линейной алгебре классическая книга представляет собой введение Стренга в линейную алгебру . Наиболее часто используемые обозначения в книге
Где - матрица коэффициентов , - переменные, которые нужно решить, а - вектор в правой части уравнения . Причина книга выбрать это обозначение является основной задачей линейной алгебры является решение линейной системы и выяснить , что вектор . При такой формулировке задача OLS-оптимизации
В области статистики или машинного обучения грамотные (из книги « Элементы статистического обучения» ) люди используют разные обозначения для обозначения одного и того же:
Где - это матрица данных , - это коэффициенты или веса, которые нужно изучить , - это ответ. В Причина люди используют это потому , что люди в статистике или машинного обучения сообщества управляемых данными , поэтому данные и реакция наиболее интересная вещь для них, где они используют и представляют.
Теперь мы можем видеть все возможные путаницы: в первом уравнении такой же, как X во втором уравнении. И во втором уравнении X не то, что нужно решать. Также для терминов: A - матрица коэффициентов в линейной алгебре, но это данные в статистике. β также называется «коэффициентами».
Кроме того, я упоминал, что - это не совсем то, что люди широко используют в машинном обучении, люди используют половинную векторизованную версию, которая суммирует все точки данных. Такие как
Я думаю, что причина этого в том, что хорошо говорить о стохастическом градиентном спуске и других различных функциях потерь. Кроме того, краткие обозначения матрицы исчезают для других задач, кроме линейной регрессии.
Матричная запись для логистической регрессии
Может ли кто-нибудь дать больше резюме по обозначениям в разных литературных источниках? Я надеюсь, что умные ответы на этот вопрос могут быть использованы в качестве хорошего справочного пособия для людей, читающих книги разных литератур.
пожалуйста, не ограничивайтесь моим примером и X β = y . Есть много других. Такие как
Почему существуют две разные формулировки / обозначения логистических потерь?