Кстати, вопрос об использовании электронных таблиц Google вызвал противоречивые (и, следовательно, интересные) мнения по этому поводу. Используют ли некоторые из вас электронную таблицу Документов Google для ведения своей статистической работы и обмена ею с другими?
Я имею в виду более старую статью, которая не казалась такой пессимистичной, но она упоминается лишь незначительно в упомянутой вами статье: Килинг и Павур, Сравнительное исследование надежности девяти статистических программных пакетов (CSDA 2007 51: 3811). Но теперь я нашел твою на своем жестком диске. В 2008 году была также специальная проблема, см. Специальный раздел по Microsoft Excel 2007 , а позднее - в «Журнале статистического программного обеспечения: о числовой точности электронных таблиц» .
Я думаю, что это давняя дискуссия, и вы найдете различные статьи / мнения о надежности Excel для статистических вычислений. Я думаю, что существуют разные уровни обсуждения (какой анализ вы планируете делать, полагаетесь ли вы на внутренний решатель, существуют ли нелинейные термины, которые входят в данную модель и т. Д.), И могут возникнуть источники числовой неточности в результате правильных вычислительных ошибок или проблем с выбором дизайна ; это хорошо обобщено в
М. Альтман, Дж. Джилл и М. П. Макдональд,
Численные проблемы в статистических вычислениях для социолога , Wiley, 2004.
Теперь для исследовательского анализа данных существуют различные альтернативы, которые предоставляют расширенные возможности визуализации, многовариантную и динамическую графику, например, GGobi, но см. Связанные темы в этой вики.
Но ясно, что первое, что вы указали, касается другой проблемы (IMO), а именно: использования электронной таблицы для работы с большим набором данных: просто невозможно импортировать большой файл CSV в Excel (я думаю о геномных данных, но это относится к другим видам многомерных данных). Он не был построен для этой цели.
R
или SAS).