Какие книги предоставляют обзор вычислительной статистики в применении к информатике?


15

Как инженер-программист, меня интересуют такие темы, как статистические алгоритмы, интеллектуальный анализ данных, машинное обучение, байесовские сети, алгоритмы классификации, нейронные сети, цепочки Маркова, методы Монте-Карло и генерация случайных чисел.

Лично мне не доставляло удовольствия работать на практике с любым из этих методов, но мне приходилось работать с программным обеспечением, которое под капотом использовало их и хотело бы узнать о них больше на высоком уровне. Я ищу книги, которые охватывают большую широту - большая глубина не нужна в этом пункте. Я думаю, что смогу многое узнать о разработке программного обеспечения, если смогу понять математические основы, лежащие в основе используемых алгоритмов и методов.

Может ли сообщество по статистическому анализу порекомендовать книги, которые я могу использовать, чтобы узнать больше о внедрении различных статистических элементов в программное обеспечение?

Ответы:



3

Возможно, вы захотите прочитать чрезвычайно популярный вопрос о переполнении стека о том, какую статистику должен знать программист или программист .


Хороший звонок. Я использую ТАК, и я не знал, что этот вопрос даже существует. Хорошо иметь перекрестные ссылки для случаев, когда вопросы могут появляться на нескольких биржах.
Томас Оуэнс

3

Вот очень хорошая книга от James E. Gentle, Computational Statistics (Springer, 2009), которая охватывает как вычислительные, так и статистические аспекты анализа данных. Нежный также автор других великих книг, проверьте его публикации.

Еще одна замечательная книга - « Справочник по вычислительной статистике» от Gentle et al. (Springer, 2004); он распространяется в формате PDF где-то в Интернете, поэтому попробуйте посмотреть его в Google.


2

Вы упомянули некоторые методы ML, так что две довольно хорошие книги (хотя, к сожалению, мой любимый на польском):
http://www.amazon.com/Machine-Learning-Algorithmic-Perspective-Recognition/dp/1420067184
http: / /ai.stanford.edu/~nilsson/mlbook.html

Для числовых вещей, таких как генерация случайных чисел:
http://www.nr.com/


+1 Книга Marsland довольно хорошая и заполнила большой пробел в существующей подборке книг по ML.
АРС

1

Я взял экземпляр « Вероятности и статистики для компьютерных ученых» - Майкл Барон в продаже с другой книгой по статистике (я, честно говоря, купил ее из-за названия - я хотел книгу, которая бы хоть как-то взглянула на статистику с точки зрения компьютерных наук, даже если это не было идеально). У меня еще не было возможности прочитать или решить какие-либо проблемы, но это похоже на солидную книгу.

В предисловии к книге говорится, что это для студентов старших курсов и начинающих студентов, и я согласен с этим. Некоторое понимание вероятности и статистики необходимо, чтобы понять содержание этой книги.

Темы включают вероятность, дискретные случайные величины, непрерывные распределения, методы Монте-Карло, случайные процессы, системы массового обслуживания, статистический вывод и регрессию.


1

Хотя это не специально вычислительная статистика, «Руководство по статистическому анализу с использованием R» - Брайан С. Эверитт и Торстен Хоторн охватывают множество тем, которые я видел в базовых и промежуточных книгах по статистике - вывод, ANOVA, линейная регрессия, логистическая регрессия, оценка плотности, рекурсивное разбиение, анализ главных компонентов и кластерный анализ - с использованием языка R. Это может быть интересно тем, кто интересуется программированием.

Однако, в отличие от других книг, упор делается на использование языка R для выполнения этих статистических функций. Другие книги, которые я видел, используют комбинации алгебры и исчисления для демонстрации статистики. Эта книга на самом деле посвящена анализу данных с использованием языка R. И чтобы сделать его еще более полезным, наборы данных, используемые авторами, находятся в CRAN - R-репозитории.


1

Статистические вычисления с R - Мария Л. Риццо охватывает множество тем в «Вероятности и статистике для компьютерных ученых» - основные вероятности и статистика, случайные величины, байесовская статистика, цепи Маркова, визуализация многомерных данных, методы Монте-Карло, тесты перестановок, вероятность оценка плотности и численные методы.

Используемые уравнения и формулы представлены как в виде математических формул, так и в виде кода R. Я бы сказал, что базовые знания о вероятности, статистике, исчислении и, возможно, дискретной математике были бы полезны для всех, кто хочет прочитать эту книгу. Фон программирования также был бы полезен, но есть некоторые ссылки на язык R, операторы и синтаксис.


1

Как компьютерный инженер, который сам пришел к анализу данных, действительно читаемой книгой, которая охватывает вещи с довольно пугающей и читаемой точки зрения (за счет того, что она не покрывает столько же, сколько любая другая книга, предложенная здесь), была книга «Программирование коллективного интеллекта» Тоби Сегарана. Я нашел это намного более доступным, чем, например, книга Бишопа, которая является отличным справочником, но углубляется в то, что вы, вероятно, захотите на первом проходе. Об Амазонке: http://www.amazon.com/Programming-Collective-Intelligence-Building-Applications/dp/0596529325


1

У CRAN есть несколько хороших примеров книг, касающихся статистического программирования. Некоторые из них не будут относиться к машинному обучению и MCMC, но каждая запись аннотирована, поэтому вы должны иметь общее представление о том, что содержится в каждой книге, чтобы погрузиться немного дальше. http://www.r-project.org/doc/bib/R-books.html

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.