R против SAS, почему SAS предпочитают частные компании?


143

Я изучил R, но кажется, что компании гораздо больше заинтересованы в опыте SAS. Каковы преимущества SAS перед R?


17
Это трагично, но я боюсь, что это правда ...
gung

19
Медицинский статистик однажды сказал мне, что они используют SAS, потому что, если они делают ошибки из-за ошибок в программном обеспечении, а это касается судебных процессов, SAS возместит их. R приходит без гарантии.
Момо

42
Правда, @Momo R поставляется без гарантии, но я хотел бы увидеть ссылку на то, что у SAS есть сильная сторона. Я не смог найти текст лицензии SAS на их веб-сайте, но смог найти что-то для одного компонента: support.sas.com/documentation/onlinedoc/sasc/doc650/common/… Это дает 90-дневную гарантию на носитель, что Программное обеспечение поставляется вместе с отказом от любых заглавных букв любой другой гарантии. Пожалуйста, дайте ссылку, кроме "кто-то сказал мне".
Брайан Диггс

13
Был просто анекдот, мне нравится прагматический цинизм комментария. Но рад, что ты проверил, я никогда не заботился.
Момо

36
На SAS распространяется та же гарантия, что и на R: нет.
Фрэнк Харрелл

Ответы:


139

Я думаю, что есть несколько вопросов (в порядке возрастания возможной действительности):

  1. Традиция / привычка : люди привыкли к SAS и не хотят узнавать что-то новое. (Это усложняет ситуацию , когда вы думаете по-разному в SAS и R.). Это может относиться ко всем, кому, возможно, придется отправлять вам код или читать / использовать ваш код, включая менеджеров и коллег.
  2. Недоверие к бесплатному программному обеспечению : у меня было несколько человек, которые сказали, что они не хотят принимать результаты от R, потому что у вас нет коммерческой компании, которая проверяет код, чтобы убедиться, что он дает правильные результаты, прежде чем он выйдет клиентам, чтобы они в конечном итоге потерять бизнес.
  3. Большие данные : R выполняет операции со всем в памяти, тогда как SAS не обязательно. Таким образом, если ваши данные приближаются к пределам вашей памяти, будут проблемы.

Лично я только думаю, что # 3 имеет какие-либо законные достоинства, хотя существуют подходы к большим данным, которые были разработаны с R. Проблемы с # 1 говорят сами за себя. Я думаю, что # 2 игнорирует несколько фактов: есть некоторая проверка, которая продолжается с R, многие из основных пакетов написаны одними из самых больших имен в статистике, и были исследования, которые сравнивают точность различных статистических программ, и R имеет конечно был конкурентоспособен.


41
Пункт 1 становится более легитимным, если вы также включите «существующую инфраструктуру» в этот баннер инерции. Если существуют существующие бизнес-процессы, в которых уже используется SAS, то существует переходная стоимость с изменением. Если это так, то это не выбор между SAS и R, а выбор между пребыванием в SAS и переходом на R, что может привести к другому выводу.
Брайан Диггс

25
Суть пункта 2 заключается в том, что, хотя некоторые пакеты R написаны экспертами, другие - нет. Кто за них ручается? Кто их проверяет? (Я знаю, что они проверены на то, что они работают, но кто проверяет, что они работают правильно?) Я знаю, вы можете посмотреть на код, но это предполагает время и способность просматривать чужой код и проверять его, часто для методов, которые очень сложны.
Питер Флом

18
@PeterFlom, вы поднимаете разумный вопрос. Поскольку пакеты становятся более эзотерическими, гарантии меньше, чем с базовыми вещами. Но как далеко вы должны зайти? Даже SEM, который является довольно продвинутым, был написан на R Джоном Фоксом. Кроме того, StasK хорошо оценивает реальность проверки статистического программного обеспечения на практике. Наконец, R гораздо более всеобъемлющий, чем что-либо еще, поэтому, когда вы хотите делать эзотерические вещи с другим программным обеспечением, вам в основном приходится кодировать его самостоятельно. Кто гарантирует точность этого кода?
gung

33
Кто именно проверяет SAS, Stata, SPSS, код? Можно ли вообще узнать, действительно ли результаты, которые они предоставляют, с помощью методов, которые они используют, действительно реализованы? Из lme4списка рассылки , например, я знаю, что сравнения с SAS появляются довольно регулярно. Но невозможно знать, должны ли мы даже делать такие сравнения. Не имея доступа к источнику, мы должны поверить тем компаниям, что результаты их программного обеспечения действительно действительны. Честно говоря, я предпочитаю иметь возможность просматривать программный код, который я использую.
Джейсон Морган

28
Правда, но сложно наказать статистическую вычислительную систему за ее полноту. Или, говоря иначе, способ R что-то сделать лучше, чем способ другой системы не делать этого.
Фрэнк Харрелл

105

Помимо хороших ответов, я бы добавил фактор смущения. Если в прошлом году вы потратили сотни тысяч долларов на поддержку SAS и SAS, и вы предлагаете ничего не тратить на R с крайне низкими ценами на поддержку (Revolution и т. Д.), Кто-то в цепочке спросит, почему. Было ли ошибкой тратить столько денег в прошлом году, когда R существовал в прошлом году? Или это ошибка - выбрасывать профессиональное программное обеспечение для чего-то, созданного группой добровольцев?

Как только проблема сформулирована таким образом, это предложение без потерь, так что, возможно, лучше не поднимать его.


47
Это, пожалуй, самый циничный ответ о перекрестной проверке. +1
вероятностная

11
@probabilityislogic: Спасибо! Чтобы было ясно, это скорее комментарий о плохом управлении высшего уровня, чем о людях, которые используют программное обеспечение. Я работал в местах, где действительно было отношение (на более высоких уровнях): «Хммм… вы не потратили все деньги, которые мы заложили для вас в этом году. Очевидно, вы можете обойтись меньшими деньгами, поэтому мы Вы сокращаете свой бюджет на следующий год и отдаете дополнительные расходы департаменту, который потратил слишком много средств ». Правила Дилберта.
Уэйн

11
«Вы не тратили деньги ...» - именно так работала советская система планирования, насколько я знаю из первых рук.
StasK

5
Кто-то в цепочке должен объяснить, что за небольшую часть стоимости лицензии SAS вы можете установить R Studio Server на виртуальную машину AWS с 16 ядрами и 256 ГБ ОЗУ - в руках 2 хороших программистов на R, это больше мощнее, чем SAS. Подумайте, как быстро миллиарды записей могут быть нечетко сопоставлены друг с другом! Или в этом отношении даже PostgreSQL с открытым исходным кодом с Python + PERL будет достигать за небольшую плату.
бродяга

1
«Или это ошибка - выбрасывать профессиональное программное обеспечение для чего-то, созданного группой добровольцев?» Это ложная дихотомия!
kjetil b halvorsen

54

Помимо того, что гунг правильно определил здесь, самая большая проблема в корпоративном мире - это наследие. И когда у вас есть качественный производственный код, который, как известно, выполняет эту работу, вы не меняете его. SAS существует с 1970-х годов, и в то время это был единственный эффективный, по тогдашним стандартам, язык сценариев для сценариев. Количество производственного кода, накопленного с тех пор в SAS в фармацевтике и правительстве, немыслимо, десятки тысяч человеческих лет. Переписывание этого в R или Stata займет несколько лет, в результате код станет более гибким, более эффективным, более прозрачным, простым и дешевым в обслуживании, но никто не будет платить за такой рефакторинг. (Мой опыт показывает, что мой код Stata обычно примерно в три раза короче; у меня когда-то был проект по преобразованию кода SPSS в Stata, где я сделал его примерно в 20 раз короче.

В некотором смысле, это аналогичная история с академическими издателями: они ведут поток конечных пользователей, поддерживая свои подписки по необходимости; Университет без подписки на Природу - это не университет. Бесплатная публикация через профессиональные сообщества сделает ее более дешевой, в наши дни люди готовят свои материалы в LaTeX, поэтому они готовы к работе с камерой, и те же люди будут предоставлять экспертную оценку, поэтому не будет никакого ухудшения качества ни по одному из измерений. Но ... нет никаких фирменных знаков и факторов влияния онлайн-журналов.

Это подводит итог всего этого: http://scatter.wordpress.com/2011/06/28/stata-12/ . Stata предпочитают в кругах экономики и политики, и чем больше я изучаю SAS, тем больше мне нравится Stata.


38
У SAS ужасающий синтаксис, который начался с чего-то похожего на JCL (язык управления заданиями IBM) для отправки пакетных заданий с перфокартами в тот же день. Замечательно, что люди все еще используют это, действительно.
Уэйн

6
+1 Мне особенно понравился BlackBerry: iOS: Android: Nokia as SAS: Stata: R: SPSS по аналогии в посте рассеяния.
Jthetzel

6
Уэйн, если вы когда-нибудь задумывались над утверждением CARDS, вы понимаете, что SAS - это статистический программный пакет для работы с перфокартами. Stata работает с прямоугольными наборами данных. R работает с объектами. Поэтому в зависимости от того, с каким форматом данных вам приходится иметь дело, один может быть лучше других.
StasK

3
Одним из важных моментов в наследстве являются такие вещи, как утверждение FDA или аналогичные правила. Индустрия, с которой я говорил, не будет касаться чего-либо (TM) после того, как они пройдут через это, чтобы быть уверенными, что им не придется снова проходить весь процесс. И это большой аргумент с точки зрения денег.
cbeleites

48

Последние семь лет я работал как программист SAS, а рядом со мной коллега программировал SAS дольше, чем был жив. Как отмечалось здесь, за SAS лежит огромное количество инерции / наследства; но SAS, как и R, - это путь к средству, а не само средство.

SAS чрезвычайно эффективен при последовательном доступе к данным, а доступ к базе данных через SQL чрезвычайно хорошо интегрирован. PROC очень хорошо документированы, но, к сожалению, не полностью стандартизированы с обозначениями (PROC OPTMODEL и IML являются двумя примерами). Это немного неуклюже, когда речь идет о написании сложного кода, и не так элегантно для параллельного кода. Я также обнаружил, что импорт CSV-файлов иногда вызывает большие страдания, и я предпочитаю сначала просто сбросить его в R, а затем в базу данных.

Хотя SAS имеет интерфейсы для общих объектов и DLL, вы не получите красивый доступ к любым заголовочным файлам или чему-то в этом роде, и распространение кода также не доступно через счастливые пакеты.

Однако мало кто беспокоится о том, чтобы включить в ваш код какой-то эзотерический, теперь уже не функционирующий или поврежденный пакет, который вам сейчас нужно поддерживать, и качество кода в SAS обычно одинаково превосходно (код ядра R также превосходен, а также свободно доступно каждому).

Как упоминалось ранее, SAS также чрезвычайно дорог, но это хороший инструмент, к которому я обращаюсь, когда знаю, что существует стандартная процедура, которая хорошо подходит для моих нужд.

R + SAS + mysql с небольшим количеством Perl, чтобы склеить их вместе, работает потрясающе :)


11
Замечание об обслуживании старых пакетов также подходит для написанного пользователем макроса или старого процесса, который sas не обновил.
вероятностная

4
R также имеет очень хорошую поддержку SQL, полученную недавно с помощью dplyrбиблиотеки - он буквально переводит синтаксис R / dplyr в SQL и вызывает базу данных, вы можете решить, какие операции выполнять на сервере БД, а какие локально, используя тот же синтаксис: cran.r-project. org / web / packages / dplyr / vignettes / database.html
Тим

41

Поэтому я использую и R, и SAS - по общему признанию в академических кругах - но есть несколько причин, по которым я иногда склоняюсь к SAS:

  1. Лучшая документация. R становится лучше, но документация, особенно официальная документация, часто бывает ужасной и непрозрачной. Кроме того, SAS поддерживается обширной инфраструктурой книг - использование R! серия помогает этому в R, но это еще не совсем там. Я могу обратиться к анализу выживания Пола Эллисона с использованием SAS , или категориальному анализу данных с использованием SAS, или к моей книге о методах Монте-Карло с использованием SAS, и у меня есть книга, написанная в довольно непротиворечивом стиле для языка, который я использую.
  2. Инерция. Это не просто «компании ленивы» - инерция тоже имеет значение. Есть институциональные знания. У такого-то есть код, который делает это - и делает это хорошо.
  3. Пакеты. Некоторые пакеты в R удивительны. Некоторые пакеты не являются. Вы должны найти их, оценить их, и даже в этом случае возникают некоторые проблемы с верой в то, что пакет настолько хорош, насколько хорош тот, кто его пишет. В это трудно поверить. По сути, SAS обладает «полной верой и авторитетом Института SAS», который имеет довольно солидный опыт.
  4. Поддержка из одного источника. Если SAS не работает, вы звоните SAS. Если R не работает, вы звоните ....?

21
"Если R сломан, вы звоните ....?" Брайан Рипли :-) (+1 за этот аргументированный ответ)
chl

6
Что касается 4), я думаю, что есть смешение понятий. Если вы используете программу, и она ломается, у вас обычно есть два варианта. Вы можете заплатить за поддержку или обратиться за бесплатной поддержкой (интернет-сообщество, литература, вы сами). R и SAS можно сравнивать как статистические языки программирования. Оба имеют свободно доступную поддержку, которую также можно сравнить. R и SAS нельзя сравнивать как платные решения для поддержки ...
jthetzel

7
... Институт SAS оказывает платную поддержку SAS. Такие компании, как Revolution Analytics и TIBCO (S +), предоставляют платную поддержку R. Если вы хотите сравнить платные решения для поддержки R и SAS, вам следует сравнить SAS Institute с Revolution Analytics и TIBCO, а не R. Я полагаю, что путаница возникает из-за тесная интеграция языка SAS с Институтом SAS и отсутствие интеграции языка R с корпоративной поддержкой и образованием, связанными с R.
Jthetzel

3
@jthetzel Я не думаю, что это «путаница». SAS язык тесно связан с SAS сервисом. Любая платформа, на которой работает SAS, имеет поддержку SAS. Это не относится к R-поддержке и языку, который не связан, возможно, вам не поможет в зависимости от платформы (попробуйте поговорить с Revolution иногда, не используя Windows или RHEL ...), и они не обязательно будут нести ответственность за Ошибки RandomPackage, где SAS будет поддерживать PROC Arbitrary.
Fomite

2
@probabilityislogic Я думаю, что это не нужно оценивать, чтобы увидеть, подходит ли оно для вашего анализа. Да, оба могут ошибаться, и оба должны быть оценены. Но я доверяю команде контроля качества SAS больше, чем доверяю мне самому.
Fomite

39

Никто не предположил, что причина, по которой он предпочитает, - это простой идиотизм. Вот две цитаты, с которыми я недавно сталкивался:

«Использование программного обеспечения с открытым исходным кодом, такого как R, не могло быть и речи - мы не могли гарантировать идеально воспроизводимый результат»

а также

«Мы не сможем оказать какую-либо поддержку для этого, поскольку это программное обеспечение с открытым исходным кодом»

Две минуты с этими людьми покажут им, насколько они не правы.


3
Две минуты с какими людьми? Без ссылок это почти как если бы вы только что сделали эти цитаты.
Дэвид Хеффернан

4
вторая цитата выглядит хорошо из ИТ-отдела совета, от них нельзя ожидать поддержки всего возможного программного обеспечения с открытым исходным кодом, которое клиент может использовать, отсюда и общее предупреждение. Я думаю , что худший анти открытым исходным кодом цитаты я слышал от SAS говоря soemthing , как «вы доверяете аэробуса разработан с открытым исходным кодом, двигатель может упасть»
PaulHurleyuk

5
@PaulHurleyuk: +1 Цитата была «У нас есть клиенты, которые производят двигатели для самолетов. Я счастлив , что они не используют бесплатное программное обеспечение, когда я на самолете «. Директором по маркетингу SAS в этой статье New York Times на R . Представитель SAS разъяснила свои замечания в более позднем сообщении в блоге .
Jthetzel

4
@PaulHurleyuk: Точно так же нельзя ожидать, что совет поддержит любое проприетарное программное обеспечение, которое клиент может захотеть использовать. Открытость не причина. Если они сказали, что не могут поддерживать что-либо, кроме поддерживаемого ими набора программного обеспечения, тогда все в порядке.
Spacedman

5
В двух случаях, которые я цитирую, вполне может быть рациональное решение, но приведенные причины явно не являются этими. Разумной причиной может быть «мы уже поддерживаем SAS, и мы не можем позволить себе поддерживать два пакета статистики». Но «Мы не можем поддержать это, потому что это открытый исходный код» - это не секвитур. Две части могут быть правдой, но заключение не следует. Это как сказать: «Елизавета - королева, потому что небо голубое».
Spacedman

23

Кажется, что одна проблема не была решена явно: прикрытие задницы. Если вы переходите на SAS и все рушится, лицо, принимающее решения, всегда может сказать, что он купил самое современное программное обеспечение, и откуда ему было знать, что оно сломается? Если он решил пойти с R, этот аргумент будет сложнее привести. Да, это связано с аргументом инерции, уже упомянутым здесь.

Несколько десятилетий назад они говорили, что «никто не был уволен за покупку IBM» , что называют величайшей маркетинговой фразой за всю историю.


2
Хотя я не уверен, что R немного менее современен, чем SAS (и что касается многих процедур, у меня сложилось впечатление, что R более современен, чем SAS). Я предполагаю, что многие пользователи SAS не знают об этом, хотя ...
Патрик Куломб

21

Как пользователь SAS и R, я бы сказал, что главная причина, по которой мы используем SAS поверх R (когда мы это делаем), - это его способность к последовательной обработке. Для обработки данных за 15 лет нам нужны только машины с ОЗУ не более 4 ГБ. Мне понадобится машина гораздо большего размера, использующая Stock R, и я не пытался перенести код SAS для работы с Revolution R.


8
+1, хотя стоит отметить, что в R существует несколько способов работы с наборами данных, превышающими объем памяти ( bigmemory , ff , фрагментация данных из базы данных, широкий спектр вариантов распределенных вычислений). Но все это требует настройки; SAS действительно будет просто проходить через все, что вы в него бросаете, что является реальным преимуществом.
Мэтт Паркер

21

Времена они меняются

По состоянию на 2015 год актуарии в возрасте до 35 лет предпочитают использовать R - в учебниках используется код R и SAS. Старые актуарии никогда не учились использовать R и предпочитают SAS и не используют R. Доля актуариев, фактически кодирующих в SAS, уменьшится.

Если вы будете искать в Google стипендию документы, относящиеся к SAS, то вы найдете стабильные 550 публикаций в год в течение последних нескольких лет. Если вы ищете документы с использованием R («R Фонд для статистических вычислений»), в 2014 году их было 25 100, а по состоянию на середину июля 2015 года - 16 700. Построение курса - это очень быстро растет!

SAS не помогала себе в течение нескольких лет, требуя больших лицензионных отчислений от университетов - которые они с тех пор отменили - но сейчас слишком поздно, многие университеты перешли на преподавание с использованием R, а не SAS.

Новые статистические методы публикуются в статьях вместе с пакетом R. Некоторые методы, которые были в базе R в течение многих лет, до сих пор не появились в SAS. Теперь вы можете использовать R внутри SAS.

Таким образом, все меняется и быстро меняется.


19

В фармацевтической промышленности SAS используется, потому что это то, что FDA использует и любит. Есть несколько серьезных причин, хотя. Результаты прослеживаются, и у выхода есть метка времени. Статистика FDA может проверить, что вы получаете. Это очень хорошо для управления базами данных, и это надежное программное обеспечение. Конечно, можно утверждать, что многие из атрибутов SAS присутствуют в других программных пакетах, включая R и SAS. Тем не менее, я думаю, что любому, кто хочет стать прикладным статистиком, работающим в промышленности, лучше всего хотя бы научиться программировать в SAS. Используйте R или STATA, если вы предпочитаете, но знаете SAS. Когда вы работаете в компании, которая хочет, чтобы вы использовали SAS, они будут платить за лицензирование.


4
Вот некоторая дополнительная информация о мышлении FDA в отношении R: blog.revolutionanalytics.com/2012/06/fda-r-ok.html
Мэтт Паркер

4
В 2008 году Фонд R опубликовал статью, в которой обсуждается использование R в регламентированных клинических исследованиях . Это должно быть хорошим справочным материалом для соавторов, которые скептически относятся к использованию R.
jthetzel

2
Я согласен с тем, что существует тенденция использовать больше R в клинических исследованиях и что многие считают, что R можно сделать столь же прослеживаемым, как и SAS.
Майкл Черник

6
FDA открыто заявляет, что НЕ одобряет или требует использования какого-либо одного программного обеспечения. Исторически верно, что большинство представленных документов использовали SAS, поэтому FDA обладает обширными знаниями по SAS, но они очень быстро освоили другие системы, используя R для довольно большого количества недавней работы, особенно в области метаанализа.
PaulHurleyuk

1
@PaulHurleyuk То, что FDA скажет публично и как они действуют на практике, не обязательно совпадает. Большинство фармацевтических компаний в основном занимаются клиническими испытаниями фазы II и III, и они, как правило, ожидают, что им придется и будет продолжать использовать SAS для анализа этих испытаний.
Майкл Черник

18

Я думаю, что эта цитата от Энн Х. Милли подводит итог того, как многие люди относятся к R:

У нас есть клиенты, которые производят двигатели для самолетов. Я счастлив, что они не используют бесплатное программное обеспечение, когда я сажусь на самолет.

К сожалению, я думаю, что это заблуждение (свободное == низшее) распространено среди широкой публики.


16

(немного не по теме): если взглянуть на это с другой стороны: некоторые преимущества R в научных кругах не применимы к промышленности.

Например, в академических кругах это явное преимущество, если вы можете сказать студентам пойти и получить программное обеспечение и работать дома. В промышленности обычно не нужно брать с собой какие-либо данные ...

Также вы не должны пробовать несколько вещей (TM), загружать тонны пакетов (даже если они проверены и проверены), использовать передовые методы. Вместо этого обычно ожидается, что вы будете придерживаться методов и кода, которые использовались годами и где поведение известно уже давно. Вы не выиграете много академических заслуг с этим.

И, конечно, как уже упоминалось: никто не рискует переделывать все виды одобрения регулирующих органов ради перехода на R. Из того, что я видел, меньше о R и больше об огромных затратах + работа для получения одобрения регулирующих органов. ,


3
Нет ничего, что нужно сделать, чтобы повторить одобрение регулирующих органов ради перехода на R.
Фрэнк Харрелл

2
@Frank: возможно, мы думаем в разных сценариях: я думаю, что вы, возможно, думаете о новом испытании (и там вы правы) - я больше думаю с точки зрения анализа процессов (химический + статистический анализ) текущих производство. AFAIK, вы не можете просто переключить там свой анализ данных (но это не страна SAS). Но я могу ошибаться.
cbeleites

2
Я не знаком с этим миром, но подозреваю, что у ученых больше свободы, чем они думают.
Фрэнк Харрелл

13

Хотя это довольно пессимистично, мой ответ будет таким: люди, которые принимают масштабные решения в таких корпорациях, как «мы просто используем SAS», также относятся к тем людям, которые не доверяют тому, чего не понимают, и автоматически считают ценность чего-то прямо пропорционально сумме денег, которые вы тратите на это. Это заставляет их предпочитать платить за SAS, а не тратить время на изучение альтернатив.


12

Зачем крупной фармацевтической компании даже хотеть перейти на R с SAS? SAS стоит миллионы, но это ничего не значит для фармацевтической компании. Однако перевод всех стабильных систем отчетности с SAS на R обойдется в 50-100 раз дороже.

У SAS есть феноменальная система поддержки: каждый раз, когда мне требовалась помощь, они могли оказать ее в течение нескольких часов.

И что именно в R есть у SAS: 1) лучшая графика ... хорошо, она большая, но графика - это еще не все. Помимо R всегда можно использовать дополнительный инструмент для создания крутых графиков, а SAS не так уж и плох, когда дело доходит до графики 2) современный и более эффективный язык программирования. Многие пользователи SAS не являются программистами и не заботятся об использовании классного языка. Они просто хотят иметь возможность анализировать данные.

Я люблю R, но для большой компании было бы безумно переходить на SAS. Это может иметь смысл для небольших фирм, хотя


3
Согласна с тобой, @Max. Наконец, ответ приходит от кого-то в отрасли. Это дорого, чтобы переключиться на R.
Дан

3
Это неверно. Стоимость поддержки программирования для SAS намного выше, чем для R. Компании нанимают запасы программистов SAS, чтобы восполнить архаичный язык, используемый SAS.
Фрэнк Харрелл

Я в промышленности и использую оба. R может выполнять манипуляции с данными и, что более важно, анализировать с гораздо меньшим количеством строк, и, следовательно, может быть разработан гораздо быстрее. Я скажу, что некоторые фармацевтические компании тщательно разработали системы SAS для нормативного программирования, которые были успешными. Суть в том, что нужно менять (на данный момент)? Если они делали это с нуля, возможно, вместо этого.
AdamO

11

Есть несколько основных преимуществ, без определенного порядка

  • SAS имеет большую установленную базу и большой послужной список

Я намеренно избегаю использования уничижительных терминов, таких как «наследие» или «привычка». Многие компании используют SAS в течение 30 или 40 лет, и у них есть миллионы строк рабочего кода. Кроме того, есть все преимущества стабильной кодовой базы с миллионами пользовательских дней в области, где небольшие ошибки могут быть критическими. Это та же самая причина, по которой Unix-версии по-прежнему популярны, даже несмотря на то, что Unix более 40 лет и в некотором смысле устарели. Наконец, существует большое сообщество опытных специалистов SAS, которые привыкли решать бизнес-задачи.

  • SAS хорошо подходит для гетерогенных, сложных данных и операционных сред

Компании располагают множеством различных источников данных, основанных на разных типах систем, а также во многих случаях в нескольких операционных средах. R совсем недавно получил некоторые чрезвычайно базовые возможности для работы с чем-то большим, чем может храниться в памяти. Сравните это со способностью SAS поддерживать встроенную оптимизированную обработку в базе данных для terradata, приведя лишь один пример. В большинстве реальных ситуаций самая сложная часть аналитики связана с данными и операционной средой. (Вам нужно запустить код оценки модели, разработанный для Windows, на мэйнфрейме? С SAS нет проблем. С R вам не повезло.) R не решает ни одну из этих проблем.

  • Пользователь не должен беспокоиться о том, чтобы быть "самостоятельно"

Пользователь SAS может быть достаточно уверен, что каждый модуль кода был протестирован квалифицированными специалистами. Нет необходимости уделять время и усилия изучению происхождения кода или независимой его проверке. Кроме того, если возникают какие-либо проблемы, надежная помощь (от чего-то простого, как документация, до чего-то столь же всеобъемлющего, как подробное изучение неожиданных результатов или поведения сложного метода), пользователь может взять трубку и получить помощь.

  • Это "достаточно хорошо"

Язык отключает некоторых людей, потому что он отличается от современных языков для общего программирования. Сказав это, язык высокого уровня, мощный, выразительный и всеобъемлющий. Короче говоря, как только вы изучите это, оно выполнит свою работу. Для компаний элегантность решения не является чем-то особенным.


2
Может быть, элегантность - но стоимость? Я думаю, что компании заботятся об этом!
вероятностная

2
R может работать на любом устройстве, от мобильного телефона до суперкомпьютера, с нулевой стоимостью, а также с мэйнфреймом, также с нулевой стоимостью.
Шон

9

Служба поддержки.

Однажды я поболтал с другом, работающим в компании, специализирующейся на установке серверов, и затем он объяснил мне, почему крупные компании всегда выбирают продукты Microsoft, а не идут с открытым исходным кодом. Преимущество Microsoft над конкурентами с открытым исходным кодом - поддержка клиентов. Если что-то пойдет не так с продуктом, компания может позвонить в Microsoft, крупные компании даже имеют персональную поддержку для них. Не так с программным обеспечением с открытым исходным кодом.

Я думаю, что это та же самая причина, по которой SAS получает приоритет над R.


2
Революция Р (или другие компании)?
Бен Болкер

4
Я думаю, что эти комментарии не верны. В мире серверов с открытым исходным кодом веб-сервер Apache является самым популярным веб-сервером.
Фрэнк Харрелл

Я никогда не говорил, что он говорил о серверах. Скорее о таких продуктах, как Microsoft Office. Я только упомянул, что он работает в мире серверов.
Раскольников

2
Напоминает мне о компаниях, которые используют sharepoint и вики с открытым исходным кодом. Почти всегда sharepoint бесплоден и обновляется только вики.
TLJ

9

А как насчет Фронтендс? Что является эквивалентом R для SAS Enterprise Guide, Web Report Studio или Enterprise Miner? Редактировать: Эти инструменты позволяют непрограммирующему пользователю использовать СКЛАД ДАННЫХ без знания базовой технологии. Они не являются в первую очередь инструментами для использования SAS как таковой. R GUI - это просто IDE для языка / системы R, AFAIK. Они не могут предоставить помощь нетехническому пользователю, который хочет получить информацию и понимание от DWH.


2
Это ответ. Что делает SAS таким ценным для клиентов (как и мы), так это простота использования для людей, которым не нужно писать ни единой строки кода.
Курт

2
@ Курт, gung не хотел иметь в виду, что это не ответ, а скорее то, что ваш ответ не подходит для этого сайта (и особенно для настоящего вопроса, на самом деле)
Стефан Лоран

Есть тонны графических интерфейсов для R, см. Stats.stackexchange.com/questions/5292/…
naught101

2
Ну, я работал с RStudio. По сравнению с SAS Enterprise Guide у него еще очень долгий путь, пока он не достигнет простоты использования для начинающего пользователя. Добавьте тот факт, что R отсутствует эквивалент сервера метаданных. И мне совершенно не хватает готового эквивалента для WRS (возможно, я слепой :)). Красота языка и производительность, которую вы можете достичь, практически ничего не значат для компаний, где 90% «клиентов» хранилища данных не могли написать «Hello World» в любой среде программирования. Это то, на что я хотел обратить внимание, и здесь предстоит проделать большую работу.
Курт

2
Спасибо за обновление вашего ответа, @Kurt. Я думаю, что это будет более полезным для будущих читателей сейчас. Это правда, что для SAS существуют предложения типа «укажи и щелкни» и «хранилище данных», которые являются более всеобъемлющими и готовыми к работе, чем R. Это разумный вопрос. +1
банде

8

Однажды я работал в консалтинговой компании, которая оказывала помощь SAS крупному производителю микросхем в Силиконовой долине. Наш контактный сотрудник в компании сказал нам, что он получил предложение от другой компании предоставить им ту же самую консультацию, используя другое программное обеспечение, которое охватывает все области, охватываемые SAS, и которое будет стоить компании доли того, что SAS взимает с них. ( 30 000 долларов США против 1 000 000 долларов США). Контактное лицо обдумало, что делать, и отказалось информировать своего босса о предложении, потому что он боялся, что его уволят за использование SAS, а не за более дешевые альтернативы. Вместо этого он настоял на том, чтобы наша консалтинговая компания дала их компании большой перерыв в наших консультационных расходах. Наша компания согласилась.


1
Таким образом, ваше контактное лицо не может утверждать, что R все еще сравнительно недавно сравнивается с SAS, и он хотел подождать, чтобы убедиться, что R был установлен, прежде чем его использовать?
вероятностная

6

Я не думаю, что безопасность приложений была упомянута. Этот вопрос был поднят в Stack Overflow, но пропущен, поскольку это было не по теме.

Я сотрудничаю с Шведским национальным советом здравоохранения и социального обеспечения, который использует SAS. Когда я говорил с их статистиками (например, с R), они утверждали, что их ИТ-специалисты предпочитают SAS, поскольку они не доверяют пакетам, загруженным в R. Моя жена также работает в SAS, и ее организация часто заявляет о той же проблеме ...

Я хотел бы видеть некоторые комментарии по этому вопросу. Я сделал быстрый поиск, но не нашел хороших ссылок ...


3
Какова альтернатива загрузке пакета, который предоставляет новые возможности (как и большинство пакетов R)? Это для дома, чтобы расти эти возможности? Это надежнее?
Фрэнк Харрелл

2
@FrankHarrell Я согласен, но я думаю, что это может быть легкой областью для разработчиков R, чтобы нацелиться и улучшить. Простым решением могут быть разные уровни безопасности для пакетов - если пакет имеет системный вызов или самостоятельно подключается к Интернету, пакет должен иметь более высокий клиренс. Это может позволить установки только с низким уровнем очистки в тех учреждениях / компаниях, где утечка данных является серьезной проблемой. Я, как пользователь, мог бы тогда также сделать дополнительную проверку, когда я решу установить пакет с высоким разрешением. (Кстати, когда запланирована ваша книга (RMS ver 2)?)
Макс Гордон

Я надеюсь, что второе издание RMS будет доступно чуть более года.
Фрэнк Харрелл

5

Самая убедительная причина, по которой я понял, заключается в том, что в SAS имеется обширная библиотека модулей, ориентированных на конкретный бизнес, которые все люди используют в этих вертикалях, так что это в некотором роде замкнуто.
Но также и то, что SAS удовлетворяет потребности этих вертикальных сегментов в бизнесе и оптимизирует их потребности - оптимизировано в смысле «пользователю не нужно делать много дополнительной работы, чтобы получить результаты». Я не пользователь SAS, так что это не предвзятая защита бизнес-стратегии SAS.


4

Будучи крупным коммерческим продуктом SAS, платные продавцы прилагают активные и скоординированные усилия для его продвижения. Я не думаю, что усилия по продвижению использования R могут соответствовать этим.


8
Да, люди должны в какой-то степени открыть для себя R на своем. Но большая часть проблемы сводится к инерции изучения нового языка. Всегда появляются новые языки, которые имеют преимущества перед старыми языками, но пользователи цепляются за старые языки (свидетель Cobol). Программирование в SAS чрезвычайно неэффективно, и, возможно, требуется вдвое больше программистов, чтобы выполнять ту же работу, что и R, но эксперты SAS рады поучаствовать в их веселом пути, и компании боятся такого рода сбоев, которые могут сэкономить им миллионы долларов. в зарплатах.
Фрэнк Харрелл

3

Я смотрю на Open Source или лицензионное программное обеспечение, как это, будь то SAS или что-то еще. Мой ИТ-отдел готов предоставить услуги нашему бизнесу. Компания не зарабатывает деньги на ИТ, только на бизнес-поддержке ИТ. Бизнес имеет годовой доход в 16 миллиардов долларов . Она стоит около $ 200 млн в год. Если бы проблема была в деньгах, я бы сократил расходы, но если бы я сэкономил 10% ( $ 20 миллионов) из моего бюджета, бизнес будет уведомление? Они просто уменьшат мой бюджет в следующем году? Если ИТ терпит неудачу, бизнес теряет доход, насколько это будет зависеть от характера отказа. Части бизнеса больше не могут приносить доход. В случае сбоя такого продукта, как SAS, я могу подать в суд по контракту. Если продукт OSS дает сбой, я не могу. Я не верну свои $16 миллиардов, но я могу получить некоторые обратно, и реально с SAS вы вряд ли потеряете много. Разница в цене и стоимости должна оправдывать любой дополнительный предполагаемый риск для бизнеса. Иногда дешевле придерживаться SAS, чем переподготовку. Иногда возникают более приоритетные вопросы, поэтому компании остаются с SAS. Некоторые компании не нуждаются в полной функциональности, и в этом случае альтернативы являются жизнеспособными. Некоторые не нуждаются в поддержке, и снова альтернативы жизнеспособны. Если вы соответствуете бизнес-требованиям, то любой из вариантов действителен, если вы хотите обеспечить поддержку для бизнеса, вам нужно посмотреть на общую стоимость владения за 5-10 лет, возможность набирать специалистов по инструментам, стабильность в продукте. так что вам не нужно переписывать все с каждым новым выпуском, учебные курсы доступны для повышения квалификации,


4
Я не слежу за твоими рассуждениями. Потраченная впустую сумма, затрачиваемая программистами на программирование на архаичном языке (SAS) по сравнению с современными бесплатными языками, ошеломляет.
Фрэнк Харрелл

4
@ Франк - я должен не согласиться с твоей характеристикой. Компетентный программист SAS может быть очень продуктивным в SAS, и компетентные программисты SAS широко доступны. Я даю вам понять, что R структурирован больше как современный язык, и поэтому может быть легче выучить программиста, который знает, скажем, Java. По моему опыту во многих компаниях продуктивность разработчиков с использованием SAS редко является существенной проблемой.
JBK

9
Используя SAS в течение 23 лет и S-Plus / R в течение 22 лет, я могу сказать, что опытный программист SAS может быть очень продуктивным, но опытный программист R может быть легко в три раза продуктивнее.
Фрэнк Харрелл

2
«Я могу подать в суд по контракту», ха-ха - неправильный код, написанный сотрудниками, гораздо чаще вызывает проблемы, чем то, что делает SAS или R «самостоятельно»
вероятностный

1

Некоторые причины, которые я не видел, упоминаются:

  1. Лучшая документация. Документация SAS является многословной, документация R краткой. Многие компании могут предпочесть подробную документацию.

  2. Лучше сообщения об ошибках. Сообщения об ошибках R часто кажутся разработанными, чтобы доказать, что человек, пишущий сообщение, умнее, чем человек, читающий его.

  3. Техническая поддержка. SAS обладает одними из лучших техподдержек, с которыми я когда-либо сталкивался, предоставляемых SAS. Вы можете получить помощь по R, но эта помощь разбросана по разным местам и не всегда доступна. Люди на различных сайтах, которые предоставляют помощь с R, являются добровольцами, и добровольцы не обязаны помогать. Людям службы технической поддержки SAS платят за то, что они делают, и делают это хорошо. Они не только делают это хорошо, они делают это вежливо что часто присутствует не во всех сообществах R (мое любимое? «Я получил помощь, набрав« help », почему бы вам не попробовать ввести« help »?»)

  4. LATЕИкс


1
Я уверен, что есть компании, которые продают техническую поддержку R. Но как хорошо, что у меня нет опыта!
kjetil b halvorsen

1

Я думаю, что угол наследства может быть большим по следующей причине. Организация нанимает человека, назовите его человеком X. Это компьютерный гуру / волшебник / и т.д. Они создают потрясающие SAS-программы / инструменты / и т. Д. Они настолько хороши, что другие люди в организации не чувствуют, что им нужно понимать, как работают программы. Они позволяют легко нажимать кнопку, и все просто работает (волшебные черные ящики).

Человек Х покидает организацию. К сожалению, знания, которыми обладает человек X, покидают организацию (управление документацией и знаниями не было приоритетом, вместо этого были рабочие программы). Их заменяет человек Y. Человек Y отлично работает с R, но не имеет представления о SAS и, следовательно, не имеет представления о том, как на самом деле работают программы SAS. Существует огромная кривая обучения, чтобы даже выяснить, чтоСTСTзначительно выше, чем годовая лицензия на SAS. Я ожидаю, что SAS проведет некоторый анализ этого компромисса, и позволит этому влиять на то, как он устанавливает плату за лицензию (ну, если бы я работал в SAS). Также обратите внимание на то, что процедуры построения SAS намного лучше, чем десять лет назад (например, proc sgplot против proc plot). совпадение, что R сделал хороший заговор первым? Думаю, нет! Это эффективно снижает эффективность от переключения, потому что прорисовка больше не так уж отличается - R все еще лучше, но недостаточно для переключения ...


0

Что касается статистики промышленности, то есть специалисты по обеспечению качества, которые (как правило) не имеют опыта программирования, статистики или науки и проводят аудит статистиков, программистов и ученых. Они хотят знать: «Откуда ты знаешь, что то, что ты делаешь, правильно?» и «Если это неправильно, как мы можем обвинять кого-то и как они будут платить за это?».

Лицензия GNU / GPL Copyleft поставляется с постоянным текстом, который гласит: «R - бесплатное программное обеспечение и СЛУЧАЙНО АБСОЛЮТНО НЕ ГАРАНТИРУЕТСЯ» в тексте с полностью прописными буквами точно так же, как я написал. Это зачет. Когда качественный человек читает этот текст, он в основном дискредитирует R. Я имею в виду, если продукт хороший, стоит добавить гарантию правильно? Такие коммерческие продукты заставили нас поверить. Фактически, именно FDA заявило, что примет регулирующие представления в R, которые отражают прогресс в индустрии программного обеспечения. (Обратите внимание, что это утверждение следует после первоначальной даты публикации вопроса.)

Для тех, кто ничего не знает о компьютерах, воображаемые сценарии безопасности, невоспроизводимости и серьезных научных ошибок не ограничены в результате этого АБСОЛЮТНО НЕДОСТАТКА ГАРАНТИИ. Мы все согласны с тем, что ошибки могут иметь катастрофические последствия. Что касается вашей лицензии SAS, у SAS есть эксперты, которые могут объяснить свое программное обеспечение аудиторам, и в случае невозможного сценария, когда SAS фактически вызывает такую ​​проблему, они могут нести ответственность за штрафы и наказания (у них также есть достаточно денег для адвокатов, чтобы гарантировать, что они будут быть полностью оправданным в таком случае). Бремя и стоимость того, чтобы аналитик / программист представил этот случай для R, в основном составляют лицензию SAS. Не то чтобы программирование в SAS полностью освобождает вас от тяжелого бремени соответствия требованиям качества!

Так в принципе, я бы сказал, litigiousness играет важную роль в требуя дорогостоящего лицензионного программного обеспечения.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.