В чем разница между статистикой и информатикой?


10

Мы всегда говорим, что статистика имеет дело только с данными. Но мы также знаем, что информатика также получает знания от анализа данных. Например, биоинформатики могут полностью обходиться без биостатистики. Я хочу знать, в чем принципиальная разница между статистикой и информатикой.


7
Нет, это просто потому, что слово «информатика» полностью утратило окончательное значение. «Биоинформатика» была придумана только для «биологии, созданной на компьютере», в этом нет ничего глубокого.

1
@mbq Согласен. «Информатика» и «Биоинформатика» утратили какое-либо значимое определение.
Fomite

ясным образом биоинформатика (примените свои результаты, чтобы наблюдать ваши результаты биологическим способом)
Камаль Алблвей

Ответы:


20

Отличный вопрос !!

Я несколько раз слышал, что биоинформатики могут обходиться без биостатистики или даже без статистики. Это совершенно верно, пока не станет ложным. На мой взгляд, общая нехватка статистических знаний имеет катастрофические последствия в этой области, как показал Кит Баггерли . Я также мог бы заметить, что отсутствие базовых знаний в области статистики (и линейной алгебры) является причиной застоя биоинформатиков в долгосрочной перспективе: без глубокого знания теории они, как правило, изобретают колесо и прибегают к специальным решениям, которые решают проблемы. ничего, кроме их собственной проблемы.

Но теперь, чтобы ответить на ваш вопрос, я согласен, что в целом статистика не может обойтись без компьютеров в те дни. Тем не менее, одним из основных аспектов статистики является логический вывод , который не имеет ничего общего с компьютерами. Статистический вывод - это то, что делает статистику наукой, потому что она говорит вам, верны ли ваши выводы в других контекстах.

Короче говоря, вы можете проанализировать чертовски свои данные, вам все равно понадобится статистика, чтобы знать обоснованность прогнозов или решений, которые вы примете на основе вашего анализа.


Спасибо. Не могли бы вы подробнее рассказать о том, что является общим принципом биоинформатики, чтобы сделать его дисциплиной. Для статистики, вообще говоря, есть две основные части, одна из которых представляет собой чисто манипулирование данными, а другая - статистический вывод, основанный на вероятности, одной из чистой математики. Основываясь на статистических моделях (вероятностных моделях), стат люди могут заниматься наукой. А как насчет биоинформатики?
Хунланг Ван

4
Биоинформатика - это просто использование компьютеров для изучения биологических вопросов. Дисциплины обычно определяются вопросами, которые они задают, а не их методами, поэтому, по моему мнению, биоинформатика должна быть частью биологии. У него есть специальное название, потому что биологи очень плохо разбираются в компьютерах, поэтому люди, которые могут это делать, должны иметь специальный ярлык. Я не уверен, что через 50 лет, когда биологи будут лучше разбираться в IT и математике, биоинформатика все еще будет существовать.
gui11aume

2
Приятно видеть, что кто-то еще ценит усилия Кейта. Он, конечно, не уклонялся от споров или трудных и неудобных профессиональных ситуаций.
кардинал

@ Cardinal Saw Keith выступил на конференции APHA год или два назад. Это был один из лучших разговоров, которые я когда-либо видел.
Fomite

9

Я считаю, что, хотя между полями существует значительное количество совпадений, есть и ключевые различия. В целом, студент, изучающий статистику (на более высоких степенях), будет посещать больше уроков по теории (математика и математика), чем студент, изучающий информатику, но студент, изучающий информатику, узнает больше о вычислительной (особенно части базы данных).

Разработка нового статистического теста скорее упадет на статистика, чем на информатика, но разработка интерфейса для пользователя для ввода данных и составления таблиц и графиков больше подойдет информатику, чем статистику.

Для статистика компьютер - это инструмент для помощи в статистике. Для информатиков статистика - это инструмент, помогающий собирать и распространять информацию (как правило, через компьютер).

Редактировать ниже здесь -----

Чтобы развернуть, вот пример. Я работал над проектами с информатиками (я статистик), где врач хочет иметь систему, в которой информация о пациентах используется для прогнозирования их риска какого-либо заболевания (например, развитие тромба) и хочет получить некоторую форму оповещение, чтобы сообщить им о риске. Моя роль в проекте (роль статистика) заключается в разработке модели, которая будет прогнозировать риск с учетом переменных предиктора (модель логистической регрессии является одной из таких моделей). Роль информатика в проекте заключается в разработке инструментов, которые собирают предикторные переменные, используют мою модель на них, а затем отправляют результаты врачу. Данные могут быть получены из электронной медицинской карты или через экран ввода данных для заполнения медсестрой или другими лицами.

Теперь я (и многие другие статистики) достаточно знаком с программированием, чтобы я мог запросить базу данных, чтобы получить предикторы и создать какой-то тип оповещения, но я рад оставить это информатикам (и они в любом случае лучше). Есть информатики, которые знают достаточно статистики, чтобы соответствовать модели логистической регрессии. Так что простую версию этого проекта может сделать только статистик или только информатик, но лучше всего, когда оба работают вместе. Если вы посмотрите на этот проект и посчитаете, что часть моделирования - это интересная часть, а сбор данных, оповещения и другие интерфейсы - это всего лишь инструменты для перемещения информации в модель и из нее, тогда вы скорее статистик. Если вы видите проектирование интерфейса, оптимизацию извлечения данных, тестирование различных типов оповещений и т. Д.


(+1) Мне нравится баланс этого ответа. Я не уверен, что понимаю, что было задумано в последнем предложении.
кардинал

1
Я думаю, что ваш пример очень хорош и дает хороший портрет основного положения земли. Хотел бы я повторить это снова только за эту часть. Приветствия.
кардинал

Ваш пример действительно классный. Большое спасибо. Теперь мне просто интересно один вопрос. Для статистика, должна ли вся статистическая модель иметь часть вывода, такую ​​как доверительный интервал или проверка гипотез, и, следовательно, основана на вероятностных моделях? В противном случае они только манипулируют набором данных путем построения графиков и суммирования.
Хунланг Ван

9

Статистика выводит из данных; Информатика оперирует данными. Конечно, они пересекаются, но вопрос о том, что имеет большую сферу, не имеет ответа.


«Статистика выводит из данных; информатика оперирует данными». Это действительно то, что я хочу подтвердить. Для вывода, всегда основанного на распределении вероятностей, оно должно включать доверительный интервал или проверку гипотез. В противном случае вы просто оперируете данными.
Хунланг Ван
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.