Является ли сильный фон в математике общим требованием для ML? - ответ и некоторые предположения о ML, представленные в виде статистики ;-)
Примерно в 1990 году у меня были надежды на помощь компьютерной алгебре, я думаю, что это так, но она довольно ограничена. Но это, безусловно, помогает ускорить изучение математики (меньше нужно развивать навыки манипуляции на практике или пытаться обойтись, просто выполняя простые упражнения). Отличным примером этого я нашел «Линейную алгебру» Фреда Сабо с Mathematica (но я уже прошел курс по линейной алгебре на продвинутом уровне теории).
Я работаю с 1988 года (используя компьютерные интенсивные методы для «конкретизации» теорем и принципов из статистики - точно), чтобы сделать ответ «нет» или, по крайней мере, не нужен (для статистики). Каждый всегда сможет понять быстрее и в целом с дополнительными математическими навыками и пониманием. Я думаю, что я начинаю приближаться, но нужно манипулируемое представление моделей, генерирующих вероятность, и вывод, который является действительным и полезным не только для игрушечных задач.
Должен ли я попытаться заполнить пробелы в моей математике, прежде чем продолжить с ML?
Это трудное усилие - в MHO почти все, кто понимает статистику, добились этого благодаря тому, что очень удобно манипулировали стандартными и особенно не очень стандартными математическими представлениями моделей, генерирующих вероятность, и математическими характеристиками логического вывода (верхние x% математической статистики Phds). Так что дело не только в получении базовых знаний, но и в том, что касается математики. (В дополнение, для меня Теория Фурье была существенной.)
Почему эти представления трудно (даже с большим количеством математики)?
Герд Гигеренцер в значительной степени установил, что нет никакой проблемы с простой болезнью положительный / отрицательный, учитывая положительный / отрицательный результат теста с использованием естественных частот ». Ссылка из связанного вопроса, кажется, хорошо использует это http://www.autonlab.org/tutorials/prob18.pdf
Почему это сложно обобщить?
Для k тестов (повторных или разных) - 2 ^ k
Для тестов, которые принимают значения v - v ^ k
Таким образом, для двоичного неизвестного - 2 * V ^ K выборки вероятности пути
Для р несколько двоичных неизвестных 2 ^ р * V ^ K
Для р кратных рациональных неизвестных Q ^ p * v ^ k
Человек быстро переходит к математике со счетными и неисчислимыми бесконечностями, чтобы справиться с этим, что даже с математической экспертизой приводит ко многим недоразумениям и кажущимся парадоксам (например, парадокс Бореля?)
Кроме того, существует линейное или нелинейное опасное недоразумение (например, скрытые опасности при указании неинформативных априоров Winbugs и других MCMC без информации для предварительного распространения ), а также взаимодействия и случайные эффекты и т. Д.