Какие пакеты R вы считаете наиболее полезными в вашей повседневной работе?


28

Повторяющаяся тема: Я только что установил последнюю версию R. Какие пакеты я должен получить?

Какие пакеты R вы не могли себе представить в своей повседневной работе с данными? Пожалуйста, перечислите как общие, так и специальные инструменты.

ОБНОВЛЕНИЕ: По состоянию на 24.10.10 ggplot2кажется победителем с 7 голосами.

Другие пакеты, упомянутые более одного:

  • plyr - 4
  • RODBC, RMySQL- 4
  • sqldf - 3
  • lattice - 2
  • zoo - 2
  • Hmisc/rms - 2
  • Rcurl - 2
  • XML - 2

Спасибо всем за ваши ответы!


1
Очень субъективный вопрос: на этот вопрос нельзя ответить, и он не подходит для сайта QA.
Egon Willighagen

3
Вероятно, должно быть сообщество вики; полезный вопрос здесь, но не имеет однозначного ответа.
Шейн

2
@ Шейн: хорошая мысль. переехал. @ Эгон: действительно субъективно. но если ответы приходят от знающих людей, я не против дозы субъективности. Я начал изучать R совсем недавно и установил несколько десятков для изучения, однако я заметил, что есть инструменты, которые я использую гораздо чаще, независимо от выполняемой задачи.
Радек

Было бы интересно, если бы StackExchange мог поддерживать какой-либо метод связывания сообщений вики сообщества между сайтами. Я держу пари, что этот вопрос был задан на Stackoverflow, и я также думаю, что статистический анализ может привлечь некоторых людей, которые обычно не посещают SO.
Шарпи

@Sharpie: было несколько интересных SO-сообщений, таких как stackoverflow.com/questions/1295955/… или stackoverflow.com/questions/1535021/… однако они не ориентированы на пакеты. и я согласен, вики-сообщество может быть очень полезным.
Радек

Ответы:




8

Я использую пакет xtable . Пакет xtable превращает таблицы, созданные R (в частности, таблицы, отображающие результаты anova) в таблицы LaTeX, которые будут включены в статью.



8

ggplot2 - передает лучшую визуализацию для R.

RMySQL / RSQLite / RODBC - для подключения к базам данных

sqldf - манипулирует data.frames с запросами SQL

Hmisc / rms - пакеты от Фрэнка Харрелла, содержащие удобные разные функции и приятные функции для регрессионного анализа.

GenABEL - хороший пакет для изучения ассоциаций всего генома

Rcmdr - неплохой графический интерфейс для R, если он вам нужен.

Также ознакомьтесь с CRANtastic - эта ссылка содержит список самых популярных пакетов R. Многие в верхней части списка уже были


8

data.table теперь мой любимый! Очень жду новой версии с большим количеством реализованных пожеланий.



6

Лично я больше всего использую следующие три пакета, все из которых доступны в потрясающем проекте Omega для статистических вычислений (я не претендую на звание эксперта, но для моих целей они очень просты в использовании):

  • RCurl : у него есть много опций, которые позволяют получить доступ к веб-сайтам, с которыми у стандартных функций в базе R возникнут трудности. Это R-интерфейс к библиотеке libcurl, который имеет дополнительное преимущество целого сообщества вне R, разрабатывающего ее. Также доступно на CRAN .

  • XML : Это очень простое действие при разборе искаженного XML / HTML. Это R-интерфейс к библиотеке libxml2, который снова имеет дополнительное преимущество целого сообщества за пределами R, разрабатывающего его. Также доступно на CRAN .

  • RJSONIO : он позволяет анализировать текст, возвращаемый из вызова json, и организовывать его в структуру списка для дальнейшего анализа. Конкурент этого пакета - rjson, но он обладает тем преимуществом, что его можно векторизовать, легко расширить с помощью S3 / S4, быстро и масштабируется до больших данных.

6

Sweave позволяет встраивать R-код в документ LaTeX. Результаты выполнения кода и, необязательно, исходного кода, становятся частью окончательного документа.

Таким образом, вместо того, чтобы, например, вставить изображение, созданное R, в файл LaTeX, вы можете вставить код R в файл и хранить все в одном месте.


4
Просто подсказка для всех тех, кто хочет начать воспроизводимые исследования с R. Я бы посоветовал вам взглянуть на новый пакет knitrвместо Sweave. Это в основном Sweave на стероидах. Это так же легко, если не проще, учиться и гораздо более гибким.
Christoph_J


4

Я считаю, что решетка вместе с сопутствующей книгой Дипаяна Саркара «Решетка: многомерная визуализация данных с R» бесценна.


4

Если вы делаете какие-либо прогностические модели, карета - это находка. Особенно в сочетании с многоядерным пакетом возможны некоторые удивительные вещи.


4

Ежедневно самый полезный пакет должен быть «чужим», который имеет функции для чтения и записи данных для других статистических пакетов, например Stata, SPSS, Minitab, SAS и т. Д. Работа в области, где R не является таким обычным, означает, что это это очень важный пакет.


3

я использую

car, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, reshape, RODBC, TeachingDemos, XML.

много.


3

Я не мог жить без

  • решетка для графики
  • xlsx или XLConnect для чтения файлов Excel
  • RTF для создания отчетов в формате RTF (я бы предпочел Sword или R2wd, но я не могу установить statconn на работе; я обязательно попробую odfWeave в ближайшее время.)
  • nlme и lme4 для смешанных моделей
  • FF для работы с большими массивами

2

RODBC для доступа к данным из баз данных, sqldf для выполнения простых запросов SQL на фреймах данных (хотя я вынужден использовать собственные команды R), а также ggplot2 и plyr



2

В основном мы используем:

  • ggplot - для графиков
  • статистика
  • e1071 - для SVM

Вы также можете проверить kernlab и каретку для SVM. Это интересные (не обязательно лучшие) варианты.
Зак


2

Для меня я использую Kernlab для Kernel-Lab Machine Learning Lab и e1071 для SVM и ggplot2 для графики





2

Я большой поклонник RCPP, когда мне нужен быстрый цикл for или для выполнения не очень R-совместимых процедур. Он очень хорошо реализован в системе R eco, может получать матрицу / разреженную матрицу без преобразования в качестве аргументов в функции.

Синтаксис C ++ прост, когда вы делаете простые вещи (что часто бывает в моем случае).

На самом деле, вам не нужно быть создателем пакетов, чтобы получить эту замечательную библиотеку.

Я говорил, что C ++ очень быстрый?


2

DoParallel и Foreach пакеты сделали мою жизнь намного проще, позволяя мне распараллелить мой код и запустить его на вычислительном оптимизированной например , на Amazon EC2 ! Я использую их очень часто. Но это было бы невозможно без AMI RStudio, выпущенных Луи Аслеттом. Наконец, я должен упомянуть пакет stringr , который действительно делает работу со строками прогулкой в ​​парке. Используйте его в любом приложении для анализа текста. И я также очень часто использую knitr для составления высококачественных отчетов о своей работе. Большое спасибо за этот удивительный пакет Yihui Xie!


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.