Какое статистическое программное обеспечение подходит для преподавания начального курса статистики в социальных науках для студентов?


11

Я ищу пакет статистического программного обеспечения, который я могу использовать во вводном курсе статистики для программы изучения социальных наук. Студенты не имеют предварительных знаний статистики и опыта работы с языками программирования. Цель состоит в том, чтобы познакомить их с основными статистическими понятиями (как средние значения, дисперсия, сумма квадратов, p-значения, ... и, наконец, линейная регрессия) и дать им возможность проводить базовый анализ самостоятельно, используя примеры наборов данных. Курс должен быть посвящен изучению понятий с помощью статистики, а не запоминания формул (хотя я думаю, что формулы важны).

Поэтому я ищу альтернативу обычному синтаксису (как обычный R) или программному обеспечению, управляемому по принципу «укажи и щелкни» (как SPSS или Rcmdr). Программное обеспечение должно быть легко усваиваемым и иметь четкий графический интерфейс пользователя, который визуализирует наборы данных и предлагает стандартные графики и таблицы. Лучше всего было бы, если бы он визуализировал все различные этапы анализа (например, чтение и манипулирование данными, вычисление описательных мер, создание описательных таблиц и графиков, вычисление выводных мер, построение выводящих графиков, экспорт в отчет).

У вас есть предложения (с открытым исходным кодом или бесплатное) статистическое программное обеспечение, которое подходит для обучения и первой практики статистики?

РЕДАКТИРОВАТЬ
Спасибо за ваши предложения. Я изучил gretl и две другие программы, которые я нашел во время моего собственного онлайн-запроса: RapidMiner и Statistical Lab . [1]
Я обнаружил, что gretlинтерфейс и вывод более понятны и сфокусированы, чем, например, Rcmdr, SPSS или Stata. Поэтому это очень квалифицированный инструмент для начала преподавания статистики с моей точки зрения.
Тем не менее, графический интерфейс RapidMinerиStatistical Labменя впечатлило то, что они визуализируют отдельные этапы статистического анализа (начиная с загрузки данных). Я думаю, что это может быть полезно для многих студентов, которые борются с обычным фокусом на математических объяснениях. Конечно, RapidMiner кажется мне слишком перегруженным функциями, меню и кнопками для начинающих, тогда как Статистическая лаборатория гораздо более сфокусирована. Большим плюсом Статистической лаборатории является консольный «R-Calculator» с «Мастером R-кода», который помогает в создании реального синтаксиса R, поскольку Статистическая лаборатория полагается на Rсвои вычисления.
Наконец, я решил начать со Статистической лаборатории в первом семестре, представляя основные понятия и перейти на RStudio (и Rcmdr) во втором семестре.

[1]: Gnumeric, SciPy, Scilab, GNU Octave и другие, как мне кажется, меньше ориентированы на социальные науки.


8
@Matthias: Я думаю, что если ваши студенты приезжают / стремятся из / для области социальных наук, их обучение R как первый шаг в статистике является излишним. У большинства из них будут проблемы с концепцией консоли, команд, синтаксиса и т. Д., И вы потратите больше времени на изучение «концепций программирования» (что такое «функция», «цикл» и т. Д.), Чем на «статистику». Я основываю это на предыдущем опыте, когда я делал уроки для Stats 101 в отделе Soc.Science; люди пропустили смысл лекций, потому что они больше сосредоточились на том, чтобы заставить R работать на них, чем на самом деле изучать их данные.
usεr11852

1
@ user11852: Вы можете быть правы, но грустно, что средние школы отсылают студентов вообще без участия в программировании. Или университеты, которые допускают этот разрыв. Не должно быть ни одного студента, приходящего в университетский класс, который не знает, что такое цикл или функция. Задержка воздействия только выдвигает проблему в другом месте.
curious_cat

2
@ user11852: Другим менее приемлемым вариантом для отделов Сатистики может быть требование, чтобы у классов "Stats 101 for Social Sciences" было обязательное условие некоторого опыта программирования или коррективного класса по программированию. В наши дни, когда почти все предметы так сильно пристрастны к вычислениям, на самом деле нет причин, по которым Программирование-101 не должно быть первым занятием, которое все посещают.
curious_cat

6
Что бы это ни стоило, я успешно использовал R в моем вводном курсе статистики по политологии. Я использовал RStudio . У меня также были еженедельные «лаборатории», где я позволяла студентам вместе работать над небольшими заданиями, пока я ходила и отвечала на вопросы. С некоторыми хорошо прокомментированными примерами ученики успевали и почти не жаловались. На самом деле они жаловались на R гораздо меньше, чем в предыдущем семестре, когда я использовал Stata. Поскольку Стата не свободна, студентам приходилось работать в течение нескольких часов, чтобы выполнять свою работу - они ненавидели ее.
Джейсон Морган

6
Я думаю, что R в сочетании с RStudio может быть отличным подходом. Это также создает основу для воспроизводимой исследовательской практики, в отличие от систем меню. Я бы порекомендовал выдать несколько шаблонов кода, которые учащиеся могут загрузить в RStudio из Интернета (RStudio делает это легко), и позволить студентам выполнить работу по изменению имен переменных и статистических моделей в соответствии с тем, что необходимо для решения рассматриваемой проблемы.
Фрэнк Харрелл

Ответы:


12

Может Гретль? http://gretl.sourceforge.net/

Это бесплатно и используется в нашем университете для студенческой статистики.


9
+1. Отличное предложение. Я всегда находил графический интерфейс Gretl интуитивно понятным, а точную и обратную связь, которую он обеспечивает, точную и без излишних излишеств, что могло бы отпугнуть некоторых менее «техничных» студентов. Кроме того, он бесплатный, хорошо документированный и имеет консоль R, если кто-то склонен увидеть что-то немного «глубже».
usεr11852

8

Я бы избегал большинства «известных» вещей, MatLab , Maple , Mathematica , JMP , SAS или Minitab , потому что, когда ваши студенты заканчивают учебу, им приходится платить тысячи долларов в год, чтобы использовать их профессионально. У каждой компании, как правило, есть свой любимый инструмент, и если вы научите их инструменту, за который их компания не будет платить, то их навыки будут потрачены впустую. Мне также не нравятся проприетарные библиотеки - они обучают пользователей нажимать на кнопки, и, если пользователь хочет перейти куда-то еще (JMP или что-то еще), не происходит перенос обучения.

Python, включая SciPy / NumPy , довольно хорош. Это с открытым исходным кодом и хорошо поддерживается. У этого есть изучаемая / легкая грамматика. Он все еще интерпретируется, поэтому он не кричит быстро, но если они не знают ни сценариев, ни электронных таблиц, то это гораздо быстрее, чем им когда-либо понадобится. PythonXY - хорошая версия, имеет хорошие библиотеки и поддержку. Мне также нравится, что через него возможно программирование GUI. Создание автономных приложений в Windows немного сложнее, но, вероятно, превосходит уровень ваших учеников. (редактировать) Sage и Cythonсущественно улучшить ценностное предложение Python. Интерфейс и удобство использования значительно улучшены. Скомпилированный код, который в 1000 раз быстрее, чем довольно хороший интерпретируемый код, звучит здорово (или удивительно) для меня. РЕДАКТИРОВАТЬ: Я получал удовольствие от использования дистрибутивов Anaconda (aka conda), и они также очень просты в использовании.

Я не большой поклонник Perl . Это немного устарело. Речь идет о разборе и обработке текста больше, чем математика / наука. Не поймите меня неправильно, он может заниматься математикой / наукой, но если вы знаете VBA, то MSWord может заниматься математикой и наукой. Быть способным - это не то же самое, что иметь конкретную работу в качестве основной задачи.

Мне нравится R , даже если вы этого не делаете, потому что он активно разрабатывается квалифицированными докторами наук по математике / статистике. Это означает, что, хотя грамматика может быть неэффективной, она будет иметь библиотеки, которые являются современными и безошибочными. (В общем)

Excel не плохое начало. Когда вы знаете одну электронную таблицу, она упрощает использование любой другой. В условиях бизнеса почти каждая компания имеет офис MicroSloth, поэтому Excel - неплохая идея. Мне не нравятся их сценарии, но это всего лишь предпочтение, я все еще могу его использовать. Это стоит около 150 долларов США по сравнению с 5000 долларов США для некоторых других программ, поэтому его стоимость для обычных людей более разумна.

Язык сценариев JMP чужд. Он не переводится на другое (не SAS) программное обеспечение. Держись подальше от этого. Единственная особенность этого языка в том, что он может (в некотором ограниченном смысле) выполнять код "R". Если вы кодируете в «R», просто используйте «R» и «RStudio».

Я не использовал MathCAD, поэтому я не могу говорить о его актуальности. Я думаю, что это более символично, чем импорт внешних данных. Пока дешевле. Это не бесплатно и не открыто. Объект на нем не переводится на объект на другом языке. ( РЕДАКТИРОВАТЬ ) Также в этой категории EES , который я также не впечатлен за пределами очень узкого окна использования.

РЕДАКТИРОВАТЬ : Я был впечатлен немного LabVIEW . Это достаточно просто, чтобы использовать его за несколько часов. Он работает очень быстро, словно в 1000 раз быстрее, чем MatLab для того же кода ( MathScript ). Если у вас есть тяжелый подъем, стоит немного подумать. Это стоит денег, но что-то около 1/5 от обычного большого железа.

Удачи

РЕДАКТИРОВАТЬ: Я бы не стал использовать Статистические LAboratory, потому что даже если вы выбираете «английский» в качестве языка, он выходит на немецком языке, и он не удаляется на Windows 7. Обе административные недостатки делают это для меня бесполезным. Я не могу управлять им, и когда я пытался удалить его, это не удалось.

Методом проб и ошибок я обнаружил настройку меню, чтобы оно отображалось на английском языке. Похоже, это относительно простой (и поэтому полезный и непротиворечивый) интерфейс с некоторыми библиотеками R для обработки и отображения данных. Мне придется больше в этом разбираться, поэтому на данный момент «жюри все еще отсутствует».

РЕДАКТИРОВАТЬ больше:

-> Здесь <- это забавная ссылка на целый другой разговор об инструментах и ​​инструментальных средствах.


2
Существует также RPy rpy.sourceforge.net , R как библиотека для Python, так что вы получите самые современные, безошибочные аспекты R с синтаксической простотой Python.
Гилли Дху

1
«Они обучают пользователей нажимать на кнопки, и если пользователь хочет пойти куда-то еще (JMP или что-то еще), то никакого переноса обучения не происходит». SAS, проприетарная программа, не особенно хорошо подходит для «нажатия кнопок», и проблемы с переносом между разными языками вряд ли являются особенностью только проприетарного программного обеспечения. Черт возьми, я больше чувствовал себя как дома, переходя от SysStat к JMP, чем от Python к R.
Fomite

@Epigrad - Я смотрю, как инженеры постоянно отключают мозги. Десятки и десятки людей. Я рад, что вы нашли для него полезность, но я очень рассчитываю, что вы являетесь выбросом, и общая тенденция вреда существенно не меняется вашим опытом.
EngrStudent

@EngrStudent: Спасибо за ваши усилия попробовать статистическую лабораторию! Настройки меню для английского языка действительно не интуитивно понятны, но после того, как они были установлены один раз, у меня больше не возникало проблем с языком. К сожалению, я не могу заставить "R-Graph Wizard" работать, хотя обычный R-Graph работает нормально, если я добавлю немного кода R. Поэтому я дам своим студентам несколько примеров фрагментов кода для создания базовой графики. Возможно я переключаюсь ранее на RStudio ...
non-numeric_argument

1

Вы можете попробовать использовать Gnumeric, широко распространенную электронную таблицу, также есть электронная таблица Open Office. При условии, что вы объясните ловушки использования электронных таблиц, в частности Excel, после окончания колледжа в их последующей практической жизни они могут не иметь такой роскоши, как SPSS, но все же могут получить полезный сервис от этих бесплатных продуктов, которые не слишком требовательны к математике и навыкам программирования , Многие офисные среды содержат Excel по умолчанию.

Посмотри на:

http://groups.google.com/group/sci.stat.math/browse_thread/thread/26fe9a9a0d91139d# - Статистика и Excel 2007

и искать похожие ссылки, такие как

http://groups.google.com/group/comp.soft-sys.stat.spss/browse_frm/thread/3940bcd6c6266f1b/d85edd4978e53568?hl=en#d85edd4978e53568 Keeling, Kellie B. & Pavur, Robert J. (2007). Сравнительное исследование надежности девяти статистических программных пакетов. Вычислительная статистика и анализ данных, 51, 3811–3831.


1

Я был CalEst . Лицензия дешевая, примерно 10 баксов, и предоставляет студентам возможность для расчетов и графики, а также отличную симуляцию / занятия. Более того, на их веб-сайте есть некоторые инструменты, в основном для дистрибутивов, которые могут оказаться полезными


Этот ответ немного короток. Не могли бы вы рассказать о том, почему вы предлагаете это программное обеспечение и какие преимущества оно имеет по сравнению с конкурентами?
kjetil b halvorsen

1

Мы начали использовать Rguroo. Это программное обеспечение недавно выпущено. Он основан на R, но знание кодирования R не требуется. Это также веб-приложение, поэтому вы просто входите в браузер. Мои ученики могут сохранить свою работу на любом этапе и вернуться, чтобы завершить свою работу. Графический интерфейс пользователя очень интуитивно понятен, а результаты выглядят великолепно.


0

В течение последних трех лет мы использовали бета-версию Rguroo на наших вводных курсах по статистике в Университете штата Калифорния, Фуллертон. Они уже (август 2019) выпустили официальную версию, см. Https://Rguroo.com, Это веб-приложение для статистики, работающее в любом браузере. Это программное обеспечение предназначено для обучения, и они предлагают один на один демо и обучение для преподавателей; просто напишите или позвоните им, чтобы договориться о демонстрации. Программное обеспечение запускает R в фоновом режиме, но вам не нужно знать R, все наведи и нажми. Он имеет много замечательных функций, включая подробные результаты, отличные графические инструменты, калькулятор вероятностей и инструменты моделирования. Мне особенно нравятся функции воспроизводимости, где вы можете сохранить свою работу на любом этапе, вернуться и продолжить с того места, где остановились. Вы также можете поделиться своей работой со студентами через то, что они называют файлами RGR. Итог ... это здорово, и мы продолжаем его использовать.


0

Я лично использую программное обеспечение DataMelt для преподавания статистики. Это очень хорошо документировано, у него есть учебники, книги и много примеров, чтобы посмотреть. Также важно то, что можно искать любой пример, и вы можете получить разумный ответ (в Javadoc и фрагментах кода). Студенты могут изучать не только Python (который является языком программирования по умолчанию), но также и то, как кодировать статистические методы в Java. На мой взгляд, это существенная сила: студентам не нужно изучать очень специализированный «статистический» язык, такой как R-stat. Они также могут изучать Java одновременно, что может открыть много возможностей, если они решат пойти в индустрию.


-1

Существует новое программное обеспечение под названием Rguroo, которое представляет собой веб-приложение. Это очень удобно в использовании, так как не требует загрузки или установки. Rguroo имеет механизм R, но для его использования не требуется кодирование R, поскольку он позволяет использовать мощность R с помощью графического интерфейса «укажи и щелкни». Каждый анализ является живым и воспроизводимым. В течение последних трех лет мы использовали это программное обеспечение для наших вводных и промежуточных курсов по статистике. На данный момент это бесплатно, и вы можете создать учетную запись на www.Rguroo.com. Исходя из имеющейся у меня информации, она останется бесплатной для всех преподавателей, и с студентов будет взиматься разумная годовая абонентская плата, где-то от 10 до 20 долларов.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.