Есть ли хорошая научно-популярная книга о статистике или машинном обучении?


40

Вокруг куча действительно хороших научно-популярных книг, посвященных реальной науке, а также истории и причинам нынешних теорий, оставаясь при этом чрезвычайно приятными для чтения. Например, «Хаос» Джеймса Глейка (хаос, фракталы, нелинейность), «Краткая история времени» Стивена Хокинга (физика, происхождение Вселенной, время, черные дыры) или «Эгоистичный ген» Ричарда Докинза (эволюция и естественный отбор). Некоторые из этих книг приводят аргументы (Докинз), а некоторые - нет (Глейк). Но все они помогают тем из нас, у кого нет глубокого научного образования, понимать сложные в других отношениях понятия.

Существуют ли такие книги, которые в основном посвящены статистике или машинному обучению?

Пожалуйста, включите краткое изложение того, что охватывает каждая книга.


Я был настолько смелым, чтобы добавить ML к названию, так как статистика и ML являются двумя темами верхнего уровня этого сайта, и в противном случае можно было бы задаться вопросом задать один и тот же вопрос для ML. Я надеюсь, что это нормально.
Штеффен

2
(+1), читая такую ​​книгу о темах, которые я знаю, иногда ... раздражает, это явно помогает получить взгляд извне и, надеюсь, идеи для объяснения непростых понятий непрофессионалам.
Штеффен

@steffen: да, мне было интересно, стоит ли мне это включать. Честно говоря, в данный момент я не интересуюсь ML, но я предполагал, что ответы будут включать книги, связанные с ML, поскольку с точки зрения поп-науки ML и статистика в основном одно и то же. В любом случае, с удовольствием
включу

@ naught101 Как насчет того, чтобы сделать это вики-сообществом?
Момо

@Momo: рад за это. Я не могу сделать это сам.
naught101

Ответы:


18

Я подозреваю, что The Lady Tasting Tea от David Salsberg - именно то, что вы хотите. Он очень написан в повествовательном стиле, почти как роман, по сути, без математики (насколько я помню), поэтому он был бы доступен любому. Я прочитал это давно и действительно наслаждался этим. Он читает очень быстро и может дать людям представление о том, что такое статистический анализ и как он может помочь нам понять мир и решить практические проблемы.


Да, повествование действительно важно. Я собирался включить это в вопрос, но некоторые из примеров, которые я использовал, не имеют превосходного описания (например, Докинз), и я забыл.
naught101

3
Только что закончил читать, и это было именно то, что я искал, так что спасибо за рекомендацию. Я обнаружил, что качество письма довольно низкое, что поначалу сильно отвлекало, но через некоторое время я к этому привык. Материал, о котором идет речь, превосходен, и он дает отличный исторический отчет о том, откуда появилась статистика и что заставило людей делать открытия, и дает вам представление о том, что еще предстоит сделать, и ощущение захватывающих возможностей получить более вовлечены в области. Посмотрим, смогу ли я заставить некоторых из моих ненавидящих статистику друзей прочитать это :)
naught101

12

Новая книга Нейта Сильвера « Сигнал и шум: почему большинство предсказаний не сработало - но некоторые не совсем соответствуют вашему описанию». Это также введение в байесовское мышление для мирян. Это привлекло некоторое внимание в последнее время, и обзор книги можно найти здесь .

Также стоит ознакомиться с книгами Левитта и Дубнера по Freakonomics .


8

Больше хорошего читает:

Недостаток Средних Сэмом Л. Сэвиджем

Обманутый Случайностью Нассимом Талебом

Обе книги представляют собой несколько предостерегающих книг о том, как быть осторожными в том, как интерпретировать вероятность и статистику в нашей повседневной жизни. Например, на финансовых рынках можно было бы неправильно использовать ежедневное распределение Гаусса как меру риска с катастрофическими последствиями, и, таким образом, мы могли бы хотеть использовать на практике более эмпирические модели (такие как симуляции Монте-Карло) на практике. Талеб очень популярен в финансовых кругах и часто предостерегает нас быть более осторожными в поведенческих предубеждениях и чрезмерной зависимости от моделирования


8

«Теория, которая не умрет» Шерона Бертша МакГрэйна - очень читаемая книга по истории байесовской статистики и общей идее, которая не увязла в математике.

Я также являюсь поклонником "Руководства по статистике карикатур" Гонника и Смита, которое представляет собой хорошее введение в общую концепцию статистики с некоторыми математическими соображениями, но представлено таким образом, что не усыпляет вас (у меня также есть мультипликационные справочники по генетике, физике и химии и прочел пару других).


6

Я хотел бы предложить следующие книги, хотя ни одна из них не идеальна, вы должны проверить:

  1. (Mis) Поведение Рынков (великого) Б. Мандельброта
  2. Пораженный молнией Джеффри Розенталь

первый более сфокусирован на финансах, но все еще статичен, а второй представляет собой введение во все интересные темы вероятности: шансы, проблема Монти Холла, функции полезности, случайные прогулки и т. д.


5

Очень хорошая книга для помощи в базовой статистической грамотности и статистических рассуждениях - и для того, чтобы обосновать это как важное - является «Тигром, которого нет » Эндрю Дилно, бывшего ведущего популярного радиошоу о прикладной статистике для BBC.

Я часто рекомендую его как статистический эквивалент популярной поп-научной книги Bad Science Бена Голдакра. Это полезно для представления базовых статистических рассуждений, для демонстрации важности базовых статистических рассуждений и для того, чтобы люди беспокоились об отсутствии базовых статистических рассуждений среди людей, которые действительно должны знать лучше (особенно политики, журналисты и т. Д.). Очень доступный, привлекательный, забавный в местах, глубоко волнующий в других! Особенно хорош как введение для тех, кто думает о числах как о «не их вещах».


4

Ян Айрес является автором книги «Супер-дробилки: почему мышление по числам - новый способ быть умным», в котором рассматриваются несколько примеров интеллектуального анализа данных.


3

Я решил заполнить этот пробел, указав несколько хороших книг в стиле массового рынка по нечетким множествам, теории информации, энтропии и статистическим рассуждениям, которые я прочитал и очень рекомендую.

• При всех нечетких вещах хорошей неформальной отправной точкой является McNeill, Dan, 1993, Fuzzy Logic. Саймон и Шустер: Нью-Йорк.

• Для хорошего знакомства массового рынка с нейронными сетями, организованного вокруг некоторых интересных рассуждений об организации человеческого мозга, см. Hawkins, Jeff, 2004, On Intelligence. Times Books: Нью-Йорк.

Для легко читаемого введения в важные темы, такие как ошибки статистики и ошибочные рассуждения, попробуйте эти три:

• Хафф, Даррелл, 1954, Как лгать со статистикой. WW Norton & Company Нью-Йорк.

• Kault, David, 2003, Статистика со здравым смыслом. Гринвуд Пресс: Вестпорт, Коннектикут.

• Смит, Гэри, 2014, Стандартные отклонения: ошибочные предположения, данные о пытках и другие способы использования статистики. Пресса офлайн: Нью-Йорк.

Следующее все связано с теорией информации и энтропией:

• Lucky, RW, 1989, Silicon Dreams: информация, человек и машина. Пресса Святого Мартина: Нью-Йорк.

• Этот автор отлично справляется с изложением информационной теории в контексте и указанием на злоупотребления ею, в то время как все еще пишет таким образом, который может понять неспециалист: Пирс, Джон Робинсон, 1961, Символы, Сигналы и Шум: Природа и Процесс общения. Харпер: Нью-Йорк.

• Я читаю этот похожий заголовок, но не могу вспомнить, является ли это более поздним изданием или продолжением: Пирс, Джон Робинсон, 1980, Введение в теорию информации: символы, сигналы и шум. Dover Publications: Нью-Йорк.

• Если я правильно помню, этот автор был легко читаемым, но все же углублялся в некоторые более продвинутые концепции: Бриллюэн, Леон, 1964, Наука, Неопределенность и Информация. Академическая пресса: Нью-Йорк.

• Также см. Бриллюэн, Леон, 1962, Теория науки и информации. Академическая пресса: Нью-Йорк.

• Я читал это давно, но считаю, что этот автор был читабельным и имел некоторые интересные наблюдения по теории информации: Бар-Гилель, Иешуа, 1964, Язык и информация: избранные очерки об их теории и применении. Addison-Wesley Pub. Ко Чтение, Массачусетс

Я хочу предупредить, что книги массового рынка по умопомрачительным темам, таким как хаос, информация, квантовая физика, вероятность, случайность, «кибернетика», самоорганизация, нечеткие множества и искусственный интеллект, содержат небольшое, но заметное меньшинство материала, который взорван выход из пропорции, иногда до такой степени, что логически недействительным. У каждой из этих теорий есть известные сторонники, которые не знают, когда остановиться на чем-то хорошем и сделать огромные логические скачки, чтобы превратить свои конкретные области в грандиозные объяснения всего, У каждого есть авторы, которые выходят далеко за рамки доказательств, вплоть до того, что игнорируют явные предупреждения со стороны основателей своих областей, как это делал Шеннон о злоупотреблении информационной энтропией. В их написании есть лихорадочный, нездоровый оттенок, который иногда квалифицируется как ненужная наука, производимая чудаками. Я мог бы назвать некоторые известные имена, которые продолжают печатать возмутительные вещи об этих темах, основанные на очевидных логических ошибках и иногда грубо ошибочных фактах. Я не буду делать этого здесь, чтобы избежать серьезной войны с пламенем, потому что мне придется вызвать некоторых идолов и священных коров. Просто знайте, что вводящий в заблуждение материал такого рода существует, и будьте готовы пометить его. Остерегайтесь экстраординарных претензий без необходимых экстраординарных доказательств.


2

«Пьяная прогулка » Леонарда Млодинова - это легко читаемое введение в основные характеристики и вероятность. Содержание предназначено для аудитории без статистической или математической подготовки, а также без уравнений. Я нашел это слишком тупым. Есть много анекдотов, касающихся различных приложений плохой статистики, и четких объяснений того, почему они были неправы.

Книга охватывает основные характеристики и условные вероятности.


1

Числа Rule your World , Кайзер Фунг, описывает важность статистики во многих системах, которые являются фундаментальными для современного общества, например, на страховых рынках.

Number Sense , также Кайзер Фунг, более конкретно говорит о «больших данных».


1

Мастер Алгоритм: как изменится наш поисковый механизм для обучения нашему миру - книга Педро Домингоса, выпущенная в 2015 году. Домингос написал книгу для того, чтобы вызвать интерес у людей вне поля.

В книге описываются пять племен машинного обучения: индуктивное мышление, коннекционизм, эволюционные вычисления, теорема Байеса и аналогичное моделирование. Автор объясняет эти племена читателю, ссылаясь на более понятные процессы логики, связи в мозге, естественный отбор, суждения о вероятности и сходстве. На протяжении всей книги предполагается, что каждое отдельное племя может внести свой вклад в объединяющий «алгоритм хозяина».

https://en.m.wikipedia.org/wiki/The_Master_Algorithm

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.