Осмысление теории статистики и приложений


13

Я недавно закончил со степенью магистра по медицинскому и биологическому моделированию, сопровождаемый инженерной математикой в ​​качестве фона. Несмотря на то, что моя образовательная программа включала в себя значительное количество курсов по математической статистике (список приведен ниже), которыми я руководил с довольно высокими оценками, я часто полностью терял взгляд на теорию и применение статистики. Должен сказать, что по сравнению с «чистой» математикой статистика для меня мало что значит. Особенно нотации и язык, используемые большинством статистиков (включая моих прошлых лекторов), раздражающе запутаны, и почти ни в одном из ресурсов, которые я видел до сих пор (включая википедию), не было простых примеров, которые можно было бы легко связать и связать с данной теорией. ..

Это фон. Я также осознаю горькую реальность того, что я не могу сделать карьеру исследователя / инженера без твердого контроля над статистикой, особенно в области биоинформатики.

Я надеялся, что смогу получить некоторые советы от более опытных статистиков / математиков. Как я могу преодолеть эту проблему, которую я упомянул выше? Знаете ли вы о каких-либо хороших ресурсах; такие как книги, электронные книги, открытые курсы (через iTunes или OpenCourseware для бывших) и т. д.

РЕДАКТИРОВАТЬ: Как я уже упоминал, я весьма склонен (отрицательно) к большинству литературы под общим названием статистики, и так как я не могу купить несколько больших (и дорогих) учебников для каждой отрасли статистики, что мне нужно с точки зрения книги это нечто похожее на то, что Tipler & Mosca для физики, но вместо этого для статистики.

Для тех, кто не знает о Типлере; Это большой учебник, который охватывает большинство предметов, с которыми можно столкнуться во время обучения в высших учебных заведениях, и представляет каждый из них от базового введения до чуть более подробного описания. По сути, идеальный справочник, купленный им в течение моего первого года в универе, до сих пор использую его время от времени.


Курсы, которые я взял по статистике:

  • большой вводный курс,
  • стационарные случайные процессы,
  • Марковские процессы,
  • Методы Монте-Карло
  • Анализ выживания

Ответы:


4

Я могу полностью понять вашу ситуацию. Несмотря на то, что я аспирант, мне иногда трудно связать теорию и применение. Если вы готовы погрузиться в понимание теории, это определенно полезно, когда вы думаете о проблемах реального мира. Но процесс может быть расстраивающим.

Одна из многих ссылок, которые мне нравятся, - « Анализ данных Гельмана и Хилла с использованием иерархических / многоуровневых моделей» . Они избегают теории, в которой они могут выразить основную концепцию, используя симуляции. Это определенно принесет вам пользу, так как у вас есть опыт работы в MCMC и т. Д. Как вы говорите, вы работаете в области биоинформатики, и, вероятно, стратегией регрессионного моделирования Харрелла также является хорошим справочным материалом.

Я сделаю это вики сообщества, и пусть другие добавят в него.


Спасибо за ваше внимание по этому вопросу. Приятно видеть, что я не единственный, кто запутался по этому поводу. При этом, я думаю, вы переоценили мою ситуацию; хотя я прошел несколько курсов и знаком с существованием ряда различных способов статистического анализа; они никогда не держатся за меня после курсов. Через пару месяцев после экзаменов я продолжаю удивляться; «Я видел / слышал это где-то, но как это работало на самом деле?» Для меня это говорит о том, что мне нужно все это разрушить и начать строить на более прочной основе.
Посеф

Я бы добавил громкое «согласие» для текста Харрелла (написание нот). Это превосходно, как и комбинация из двух пакетов кода R, которая сопровождает его. Я также думаю, что «Современная прикладная статистика с S» от Venables и Ripley была бы хорошим приобретением. У меня был базовый уровень подготовки (со степенью бакалавра по физике), прежде чем я начал использовать MASS для изучения R. В этом тексте есть множество практических знаний.
Dwin

Книга регрессии Гельмана замечательна, он все очень хорошо объясняет и предоставляет R-код, который действительно полезен для проверки вашего понимания материала.
richiemorrisroe

2

Вы знакомы с Байесовским анализом данных (Гельман, Карлин, Стерн и Рубин)? Может быть, это то, что вам нужно в дозе.


2

Все проблемы со статистикой в ​​основном сводятся к следующим 4 шагам (которые я позаимствовал у @whuber для ответа на другой вопрос ):

  1. Оцените параметр.

  2. Оцените качество этой оценки.

  3. Изучите данные.

  4. Оцените подгонку.

Вы можете обменять параметр слова с моделью слова .

Книги статистики обычно представляют первые два пункта для различных ситуаций. Проблема в том, что каждое реальное приложение требует своего подхода, а следовательно, и другой модели, поэтому большая часть книг заканчивается каталогизацией этих различных моделей. Это приводит к нежелательному эффекту, так как легко потерять себя в деталях и упустить общую картину.

Большая иллюстрированная книга, которую я от всей души рекомендую, - Асимптотическая статистика . Это дает строгое отношение к теме и математически "чисто". Хотя в его названии упоминается асимптотическая статистика, большой секрет в том, что большинство методов классической статистики по существу основаны на асимптотических результатах.


2

Я думаю, что наиболее важным здесь является развитие интуиции о статистике и некоторых общих статистических концепциях. Возможно, лучший способ сделать это - иметь домен, которым вы можете «владеть». Это может обеспечить положительный цикл обратной связи, в котором понимание домена помогает вам лучше понять основную статистику, помогает понять больше о домене и т. Д.

Для меня эта область была бейсбольной статистикой. Я понял, что тест, который идет 3 на 4 в игре, не является «настоящим» .750 нападающим. Это помогает понять более общую мысль о том, что примеры данных не совпадают с базовым распределением. Я также знаю, что он, вероятно, ближе к среднему игроку, чем к нападающему .750, так что это помогает понять такие понятия, как регрессия к среднему. Оттуда я могу перейти к полномасштабному байесовскому выводу, где в моем предыдущем распределении вероятностей было среднее значение среднего бейсболиста, и теперь у меня есть 4 новых выборки, с помощью которых можно обновить мое апостериорное распределение.

Я не знаю, что этот домен для вас, но я думаю, это было бы более полезным, чем простой учебник. Примеры помогают понять теорию, которая помогает понять примеры. Учебник с примерами хорош, но если вы не можете сделать эти примеры "вашими", то мне интересно, получите ли вы от них достаточно.



1

Все учатся по-разному, но я думаю, можно с уверенностью сказать, что примеры, примеры, примеры, очень помогают в статистике. Моим предложением было бы выучить R (достаточно основ, чтобы сильно помочь), и тогда вы можете попробовать любой пример, пока ваши глаза не кровоточат. Вы можете отсортировать, подогнать, построить, назвать. И, поскольку R ориентирован на статистику, по мере изучения R вы будете изучать статистику. Те книги, которые вы перечислили, могут быть атакованы с точки зрения «покажи мне».

Поскольку R бесплатен, а многие исходные материалы бесплатны, все, что вам нужно инвестировать, это ваше время.

http://www.mayin.org/ajayshah/KB/R/index.html

http://math.illinoisstate.edu/dhkim/rstuff/rtutor.html

http://www.cyclismo.org/tutorial/R/

http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htm

http://www.statmethods.net/about/books.html

Есть много хороших книг по R, которые вы можете купить, вот одну, которую я использовал:

http://www.amazon.com/Introductory-Statistics-R-Peter-Dalgaard/dp/0387954759

Редактировать ============

Я забыл добавить пару ссылок. Если вы используете Windows, хорошим редактором для R является Tinn-R (кто-то другой может добавить ссылки для редакторов на Mac или Linux).

http://www.sciviews.org/Tinn-R/

http://cran.r-project.org/web/packages/TinnR/


спасибо за ссылки, я постараюсь просмотреть их столько, сколько смогу в ближайшие недели ... Я уже один раз подвергался воздействию R, в курсе анализа выживания, в котором мы провели многофакторный регресс (cox и aelen модели) и кучу других вещей, которые я не могу вспомнить. Мое впечатление о R, как о человеке, который очень привык к MATLAB, было довольно негативным, но я сделал это во многом из-за того, что нас более или менее бросили в глубокий конец бассейна, а затем ожидали научиться плавать в одиночку, что, конечно, привело к тому, что я ненавидел программное обеспечение с тех пор :) Время изменить это, возможно,
posdef

1

Я лично любил это, у которого было действительно хорошее сочетание теории и применения (с большим количеством примеров). Это было хорошее совпадение с Казеллой и Бергером для более теоретического подхода. И для широкого обзора кисти это .


Обе книги, кажется, имеют хорошие отзывы об Амазонке, может кто-нибудь добавить какие-либо мнения (возможно, более подробно) по этим вопросам? кстати, под casella & berger вы имеете в виду «Статистический вывод»?
Посеф

Да, «статистический вывод». Для меня большой шаг от понимания вероятностных моделей к пониманию того, как использовать данные для тестирования моделей и оценки параметров моделей. Особенно книга Дэвисона действительно сосредотачивается на этом пункте.
alwaysean
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.