Какую книгу рекомендуется начинать изучать статистику одновременно с использованием R?


50

Книги для изучения статистики с использованием R

Какую именно книгу я ищу.

То, что я ищу, это книга, которая обучает вас статистике, используя R, чтобы дать вам практический опыт и, таким образом, в конечном итоге помогает вам изучать R вместе. Я видел на Амазонке много книг, которые пытаются это сделать, но не с R. Например, Minitab и SAS.

Книга R и Статистические Вычисления вариант? - до сих пор не ответил .

Книга R и статистические вычисления: введение в анализ данных с использованием S-Plus кажется жизнеспособным, но мнение читателя здесь будет полезным и желанным.

Как книга относится к статистике курсов?

Чтобы быть еще более точным в том, что я искал, рассмотрим эти два курса обучения по статистике на математическом факультете университета. В настоящее время я студент:

Промежуточная статистика и вероятность и статистика , то есть я ищу в книге обычный курс статистики, идущий на промежуточный уровень, а не просто доску и бумагу, где вы изучаете и используете R вместо этого. Это также означает, что я ищу книгу, которая предполагает, что я хочу изучать статистику с самого начала.

Эта книга тоже для исследователей.

Я также являюсь исследователем-программистом, но я предполагаю текущую ситуацию, когда вы обнаружите множество данных и хотите изучить статистику для написания кода для автоматизации, которая в значительной степени применима ко многим другим областям.

Это означает, что я не заинтересован в изучении каждой детали каждого отдельного свойства для каждой кривой, но меня больше интересует понимание данных для моей области исследований, хотя я не возражаю, если книга захочет углубиться в это. ,

В качестве окончательной мотивации я читаю научные статьи в различных сообществах, которые утверждают, что результаты основаны на статистическом выводе, в то время как нет четкого доказательства того, нарушаются или нет статистические предположения / ограничения.

Книга AR, в которой не много о статистике, не гарантирует, что я не буду следить за этой практикой, и поэтому я решила искать книгу, похожую на курс статистики, используя R, а не играть с обзорной книгой.

Похожие вопросы в Cross Validated.

Ответы и отзывы на этот вопрос.

@Julie

Предлагаемых книг было немного, я уже сталкивался, но, к сожалению, меня это не устраивает:

Вводная статистика с R , Использование R для Вводной статистики , Статистика: Введение с использованием R - это несколько книг, которые я уже изучал на Amazon, но они посвящены обзору статистики или делают предположения, которые требуют предыдущих знаний статистики. Проблема с обзорными книгами в основном заключается в том, чтобы не привлекать внимание к предположениям, ограничениям и предоставить достаточно объяснений, чтобы привести к смыслу информации.

Если вы считаете, что нет ни одной книги, которая могла бы удовлетворить эту потребность, или считаете, что книга R или Статистические вычисления: Введение в анализ данных с использованием S-Plus подойдет, я также был бы признателен за этот тип ответа.

@ Кристофер Аден

Введение в вероятности и статистику Использование R кажется наиболее близким, но все же общим в целом к ​​тому, что я искал.

То, чего я ожидал, это такая книга, как Дэвид С. Мур, Основы статистики, потому что:

  • Он охватывает все предметы статистики.
  • Он использует два инструмента, miniTab и другие, для практического обучения только что объясненному методу.
  • Это очень подчеркивает предположения и ограничения. Это очень важно для исследователя, который не прошел углубленный курс статистики и хочет использовать статистику. Вряд ли обзорные книги охватят их, что опасно для исследователей.
    • Вы можете увидеть содержание книги здесь . Обратите внимание на то, как основное внимание уделяется статистике и использованию инструментов, чтобы улучшить понимание и научить студента, как использовать инструменты, чтобы сделать статистику после обучения более простым способом. Дело не в инструменте, а в статистике!

Я хочу точно так же, но используя R.

@ Григорий Демин

Он использует R в качестве примеров педагогики, предполагает, что вы хотите изучать статистику, и, самое главное, это открытый исходный код. К сожалению, не охватывает ни ANOVA, ни ANCOVA, ни более продвинутых предметов.

@ Питер Эллис

Хорошее предложение для учебника, который охватывает то, что нужно в этом вопросе.

Книги по мнению автора, которые отвечают на вопрос.

@ Питер Эллис и @ Грегори Демин.

Коллекция R Книги на Амазоне

Амазонскую дискуссию о R книгах для разных студентов можно найти здесь .

Видеолекции по статистике с использованием R

Google Tech Talks от 2007 года, который также мотивировал этот вопрос и охватывает больше о Data Mining, а не статистику, но с использованием R здесь .

Ответы:


15

Я думаю, что одна из причин, по которой так сложно ответить на это, состоит в том, что R настолько мощен и гибок, что реальное введение в программирование на R выходит далеко за рамки того, что обычно требуется при введении в статистику. Книги, которые преподают статистику с использованием MiniTab, JMP или SPSS, делают относительно простые вещи с программным обеспечением, которое едва затрагивает поверхность того, на что способен R, когда дело доходит до манипулирования данными, моделирования, пользовательских функций и т. Д.

Сказав это, я думаю, что « Современная статистика Уилкокса для социальных и поведенческих наук: практическое введение» (2012) - блестящая новая книга. Он не требует статистических знаний и выводит вас с нуля, вплоть до широкого спектра современных надежных методов; и предполагает не намного больше знаний R, чем способность открыть его и загрузить набор данных. Он также охватывает многие классические методики, включая ANOVA (упоминается в OP).

Я бы воспринял эту книгу как эквивалент книг, в которых одновременно представлена ​​статистика и пакет статистики, такой как SPSS. Тем не менее, это не научит вас программировать на R - только как проводить современный статистический анализ с его помощью, с акцентом на надежные методы, которые решают известные проблемы классического анализа, которые ограничены большинством других подходов к обучению статистике.

Три проблемы с классическими методами, которые эта книга особенно касается с самого начала, - это выборка из распределений с тяжелыми хвостами; асимметрия; и гетероскедастичность.

Wilcox использует R, потому что «С точки зрения использования преимуществ современных статистических методов, R явно доминирует. При анализе данных это, несомненно, самая важная разработка программного обеспечения за последнюю четверть века. И это бесплатно. Хотя классические методы имеют фундаментальные недостатки не предлагается полностью отказываться от них ... Следовательно, приводятся иллюстрации того, как применять стандартные методы с R. Особое значение здесь имеет то, что, кроме того, приводятся иллюстрации относительно того, как применять современные методы с использованием более 900 R функции написаны для этой книги. "

Эта книга настолько хороша, что после того, как мы купили копию для работы, я купил свою собственную копию дома.

Заголовки глав:

  1. числовые и графические сводки данных;
  2. вероятность и связанные понятия;
  3. распределения выборки и доверительные интервалы;
  4. проверка гипотезы;
  5. регрессия и корреляция;
  6. методы начальной загрузки;
  7. сравнение двух независимых групп;
  8. сравнение двух зависимых групп;
  9. односторонний ANOVA;
  10. двухсторонние и трехсторонние конструкции;
  11. сравнение более двух зависимых групп;
  12. множественные сравнения;
  13. некоторые многомерные методы;
  14. устойчивая регрессия и меры ассоциации;
  15. основные методы анализа категориальных данных;

Дальнейшее редактирование - проверив пример Дэвида Мура о том, что вы ищете, я действительно думаю, что книга Уилкокса отвечает потребностям.


1
Большое спасибо, я рад получить еще одну ссылку, которая также доступна в виде печатного тома. Я отредактирую основной пост позже, чтобы включить вашу ссылку, если никто не сделает этого к этому времени! Действительно очень ценится. Просто чтобы подтвердить, ты имеешь в виду, что это учит тебя строить теорию, которая упоминается? Это более чем хорошо для меня! Пожалуйста подтвердите.
Oeufcoque Penteano

Я не совсем уверен, что вы подразумеваете под «построением теории», но, безусловно, он широко использует графики и имеет код R для выполнения всех теорий, которые он охватывает (как статистический вывод, так и построение графиков). Wilcox также предоставляет свой собственный пакет функций или ссылки на чужие для передовых надежных подходов, разработанных в последние несколько десятилетий. Каждая техника поставляется с примерами, включая код. Я отредактировал ответ, включив заголовки глав.
Питер Эллис

Да, вы все правильно поняли! Куски кода, которые помогают мне сделать всю теорию о R, были бы очень желательны и необходимы в том, что я изучаю. Спасибо за предоставление списка! Я также нуждался в книге, которая говорила бы о начальной загрузке. Уже заказываю эту книгу. Скоро отредактирую основной пост.
Oeufcoque Penteano

Я уже просматриваю эту книгу. +500 на это предложение, именно то, что я искал: толстый том, полный информации о статистике и соответствующей функции, чтобы использовать ее на R (это бесплатно и с открытым исходным кодом, ура!). Это очень недорогое по размеру этой книги и ее уникальности. Не бойтесь быть поведенческими науками. Я использую его, несмотря на то, что я студент CS. Я обнаружил, что книги по поведенческой статистике мне даже больше помогают, чем статистические, чтобы понять, что происходит. Я не говорю, что чистая статистика бесполезна, она вам нужна. Я использовал Пола Мейера (1965).
Oeufcoque Penteano

6

1
Отличное предложение, я считаю это правильным ответом, если ответа больше нет по этому поводу, так как этот еще не охватывает более продвинутые концепции, такие как ANOVA (или, по крайней мере, то, что предлагает поиск). Отлично для того, чтобы быть свободным ..
Oeufcoque Penteano

4

@ Пост Джулии о книге Верзани - отличный выбор для тех, кто не имеет опыта работы в области статистики и статистики. Он достаточно мягкий как для R, так и для статистики, который используется отделом политических наук в Калифорнийском университете в Дэвисе, и у этих студентов нет ни классов по программированию, ни математики более высокого уровня. Его работа доступна через его пакет CRAN, simpleR .
Поскольку вы пришли из области компьютерных наук, я не думаю, что вам нужно очень осторожное введение в R. Я бы предположил, что вы достаточно хорошо разбираетесь в структурах данных, области видимости и зачем вам нужен отладчик. Для очень ориентированного на вычисления подхода к R (больше, чем вы могли бы даже увидеть в классе статистического программирования в отделе статистики старшекурсников), посмотрите «Искусство программирования R» Норма Матлоффа., Чтобы узнать, интересует ли вас это, у Мэтлоффа есть черновая предварительная версия, доступная на его веб-сайте . Если вам нравится его стиль, я бы порекомендовал взять готовую копию. Он профессор CS, и он пишет книгу больше для аудитории CS, чем для аудитории статистики.
У Дж. Керна (здесь часто пишут) также есть онлайн-книга под названием « Введение в вероятности и статистику с использованием R» . Я лично чувствую, что это замечательный сервис для знакомства с кишками Р.
Я понимаю, что ваш вопрос направлен на получение ответов, направленных на специализацию CS, но, пожалуйста, также внимательно изучите эту тему: Какую книгу вы бы порекомендовали для ученых, не являющихся статистиками?


1
Я полагаю, что Введение в Вероятность и Статистику Используя R является самым близким, но все еще не то, что я ищу. Я редактирую вопрос в секунду, чтобы дать ссылку именно на то, что я ищу, но, к сожалению, вместо miniTab используется R. Программирование в искусстве R, похоже, больше связано с R, чем с фактом изучения статистики (поправьте меня, если я неправильно), и снова предыдущая книга касается того, насколько я достаточно строг в статистике, чтобы делать допущения о фоне статистики, чего, к сожалению, мне не хватает. Я также суммирую основные моменты.
Oeufcoque Penteano

Вы правы в отношении TAoRP - в нем больше внимания уделяется программированию, чем изучению статистики. Я немного смущен вашим вопросом, хотя. Если вы не хотите начать изучать математическую статистику, вы должны сделать некоторые предположения и принять их на веру - по крайней мере, кратко. Вам нужна книга, которая знакомит со статистикой, содержит примеры в R и не скрывает предположения? Большинство вводных книг обеспечат некоторую интуицию, лежащую в основе предположений моделирования, но могут не формализовать логику. Возможно, вам нужно будет прочитать книгу по математике.
Кристофер Аден

Пожалуйста, смотрите книгу, которую я только что упомянул в моем последнем редактировании по этому вопросу. Это именно то, что я хотел. На самом деле вопрос возник из чтения фрагментов этой книги. Я хочу то же самое, но с Р. Я также выделил в пулях, что в книге так важно из огромной мотивации для тех, кто никогда не сталкивался с книгой. Надеюсь теперь понятно. Оглавление книги также можно посмотреть здесь whfreeman.com/Catalog/product/…
Oeufcoque Penteano

3

Я нашел эту книгу очень полезной, но она предполагает некоторые знания основных статистических терминов, таких как p-значение, ANOVA и так далее.

Эта книга предлагает более мягкое введение в сами статистические понятия ...


+1. Книга Верзани - очень нежное введение, и она также доступна из его пакета CRAN. Книга Далгаарда тоже хороша, и он, безусловно, говорит как эксперт, не будучи незнакомцем в мире R!
Кристофер Аден

@ChristopherAden - какую книгу вы бы порекомендовали для создания прочной основы для концептуального мышления о статистике , не углубляясь (вообще, на самом деле) в саму математику?
Джули

@ Джули, какая у тебя специальность? В один из дней я получил книгу профессора социальных наук о статистике для студентов социологии. Иногда они более полезны, хотя в комментариях амазонки профессор упоминал, что они склонны совершать больше ошибок, особенно в формулах, что опасно для профессоров, которые не слишком
увлекаются

Джули: Это определенно вопрос, который я буду изучать, чтобы дать лучшие рекомендации. Я узнал от статистики: искусство и наука обучения на основе данных, Агрести и Франклин. Я считаю, что подход, основанный на приложениях, великолепен. Он не предлагает 50-50 разделений статистики и R, которые хотел ОП, поэтому я не стал упоминать об этом. Я все еще новичок в статистике, так что возьмите мои рекорды с долей соли.
Кристофер Аден

1
Привет, Джули. Было бы неплохо, если бы вы дали полный ответ на каждую книгу в своем ответе. :)
кардинал

1

Хорошая книга выпускается в Университете Аделаиды, ее можно бесплатно скачать через Интернет и приобрести в печатном виде.

Изучение статистики с помощью R

Он очень хорошо разбит по своей структуре и включает в себя введение в R, а также базовое введение в статистику, прежде чем перейти к более углубленным темам.

На веб-сайте R имеется очень глубокий список книг, в котором он приводится в качестве справочного материала, однако в настоящее время я еще не прочитал названия, и я буду обновлять его по мере продвижения вперед.

https://www.r-project.org/doc/bib/R-books.html


0

Изучение статистики с использованием R от Randall E. Schumacker выходит в январе 2014 года из SAGE Publications. Содержит весь материал в проводке.


3
Люди могут сообщить нам о своей работе. Мы высоко ценим такие знания из первых рук. Тем не менее, это более чем хорошая идея, чтобы признать связь с какой-либо рекомендацией: это дает рекомендации больше доверия и дает вам кредит, который вы заслуживаете, тоже :-). Возможно, вы могли бы воспользоваться этой возможностью, Рэнди, чтобы усилить свой ответ, признать свое авторство и рассказать больше о том, почему ваша книга будет отличным выбором для целей, указанных в этом вопросе. И добро пожаловать на наш сайт!
whuber
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.